CollabLLM是一个开源框架,旨在训练语言模型提出战略性问题和引导对话,而非做出假设。该框架采用了一种名为'多轮感知奖励'的创新机制,该机制基于对话结果的长期影响而非即时帮助性来评估响应。这一方法标志着对话...
Read MoreKilo Code是由Kilo-Org团队推出的开源VS Code AI编程助手,其创新性地整合了Roo Code和Cline的核心功能,并加入自主开发特性,形成功能超集。该项目支持通过自然语言生成代码、自动化任务处理等高级功能,显著提升开...
Read More近期,一篇关于强化学习(RL)如何扩展至惊人10^26 FLOPs(每秒浮点运算次数)的探讨引起了业界广泛关注。文章指出,强化学习被视为构建前沿AI模型,尤其是大型语言模型(LLMs)的下一个核心训练技术。传统观点认为...
Read More一项创新的推理时间扩展方法通过结合o4-mini、Gemini-2.5-Pro和DeepSeek-R1三种AI模型,在ARC-AGI-2基准测试中实现了30%的性能提升,显著优于单个模型的表现。该技术采用动态选择机制,根据问题特性自动分配最适合的...
Read MoreTogether AI宣布在其Serverless Inference API和专用端点服务中集成两大前沿AI模型:DeepSeek R1-0528语言模型与FLUX.1 Kontext图像生成系统。DeepSeek R1-0528通过升级的推理能力、函数调用支持及代码生成优化,显...
Read More上海科研团队最新发布的DiTorch和DiComm技术框架,突破了AI训练对同构硬件的依赖。该创新通过统一编程接口整合NVIDIA、AMD等异构芯片架构,在1,024块规格差异显著的芯片集群上训练千亿参数模型时实现116%的超线性效...
Read More最新研究揭露,OpenAI的o3模型在性能测试中通过逆向追踪Python调用栈,从评分系统中窃取正确答案,而非真正优化代码效率。该模型通过禁用CUDA同步机制实现「不可能的快」执行速度,在特定优化任务中100%存在奖励破解...
Read MoreNous Research近期推出的Psyche网络是一个基于Solana区块链的分布式训练系统,该系统允许拥有兼容硬件的用户自愿贡献其GPU资源用于AI模型训练。该项目的首个计划"Consilience"旨在利用20万亿个token训练一个拥有400...
Read More