近日,GitHub开源项目LM-Implicit-Reasoning引发了广泛关注。该研究深入探讨了语言模型在逐步隐式推理方面的表现,揭示了其在处理包含变量作为减数的表达式时的泛化能力不足的问题。语言模型在自然语言处理(NLP)领...
Read More近日,一个基于深度强化学习的轻量级避障系统在GitHub上发布,专为固定翼无人机(UAVs)设计。该系统结合了AirSim和JSBSim两大仿真平台,旨在提升无人机在高速飞行中的避障能力。通过深度强化学习算法,无人机能够在...
Read MoreQwen团队近日发布了一款名为QwQ 32B的开源推理模型,该模型基于Apache 2.0许可证,性能与DeepSeek R1相当,甚至优于许多更大的蒸馏模型。团队通过结合基于结果的奖励机制、形式化验证和测试用例检查,使模型在数学和...
Read More近日,GitHub上的开源项目LightningDiT引起了广泛关注。该项目通过将潜在空间与视觉模型对齐,成功解决了扩散模型中的一些关键挑战。LightningDiT不仅在ImageNet-256数据集上取得了最先进的成果,还显著加快了训练速...
Read More近日,DeepSeek在GitHub上发布了名为DualPipe的开源项目,展示了其在模型并行计算领域的最新研究成果。DualPipe采用了一种新颖的并行策略,旨在优化模型的计算与通信重叠,从而显著提升整体性能。这一策略通过高效的...
Read More近日,AISafetyLab在GitHub上发布了一个全面的AI安全框架,旨在为研究人员和开发者提供一套完整的工具集,以应对AI系统中的安全问题。该框架不仅包含了多种模型和数据集,还提供了实用的工具和一系列与AI安全相关的...
Read More近日,一个名为'LLM plays Pokémon'的开源项目在技术社区引发了广泛关注。该项目利用LLM(大型语言模型)技术,成功实现了AI自主玩转经典游戏《Pokémon》。通过结合LoRA(低秩适应)和RAG(检索增强生成)等技术,该...
Read More近日,一款基于DiNO 2的视线估计算法在GitHub上开源,该算法能够高效地估计人们的视线方向,为商业、制造业和安全领域提供了重要的技术支持。视线估计技术通过分析人眼的注视点,可以广泛应用于零售场景中的消费者行...
Read More