近日,Open Reasoner Zero项目在GitHub上正式发布,该项目旨在复现零推理(Zero Reasoning)范式,并提供了完整的开源资源,包括训练数据、脚本和模型权重。零推理是一种新兴的人工智能推理方法,旨在通过简化推理过...
Read More近日,一项名为Model-Guidance(MG)的技术在扩散模型训练领域取得了突破性进展。该技术通过引入后验概率优化目标,显著提升了扩散模型的训练速度和推理效率。实验结果显示,采用MG技术的扩散模型在ImageNet 256基准...
Read More近日,一项创新的研究展示了使用3D Gaussian Splats渲染的逼真环境来训练端到端驾驶强化学习(RL)模型的潜力。该研究通过构建高度真实的虚拟驾驶场景,显著提升了模型的训练效果。实验结果表明,与传统方法相比,采...
Read MoreDeepEval是一个开源框架,专注于评估和测试大型语言模型系统。它整合了最新的研究成果,通过本地运行的模型来评估模型输出。DeepEval支持通过RAG、微调、LangChain、LlamaIndex等多种方式实现的应用。该框架可帮助开...
Read More近日,一项关于表示容量极限的研究引起了广泛关注。该研究尝试将尽可能多的Token嵌入到一个固定大小的向量中,成功实现了将1568个Token压缩至单一向量。这一突破不仅展示了embedding技术的强大潜力,也为LLM和agent...
Read More近日,Gatsby的开发者团队宣布推出了一款全新的开源JavaScript agent框架——Mastra。该框架旨在为开发者提供一个高效、灵活的工具,以简化复杂agent系统的构建过程。Mastra不仅支持LLM、embedding等先进技术的集成,...
Read More近日,DeepSeek公司推出了一项名为Native Sparse Attention的创新算法技术,旨在加速传统的二次Attention计算。该技术通过硬件对齐和原生可训练的稀疏Attention机制,实现了高达11倍的计算速度提升,同时保持了整体...
Read More近日,Valve宣布正式公开其经典多人射击游戏《Team Fortress 2》的源代码。这一举措旨在为开发者社区提供更多的资源和工具,以便他们能够更好地理解和扩展游戏的功能。Valve表示,此次发布的代码将包括游戏的核心逻...
Read More