Meta(原Facebook)旗下研究团队近日在GitHub开源了AIRS-Bench基准测试框架,旨在系统性地量化大型语言模型(LLM)代理在真实世界人工智能研究任务中的端到端能力。该基准包含20个精心设计的机器学习研究任务,每个...
Read More近期,一个值得关注的现象是Mac Mini在全球多地售罄,其背后驱动力并非传统创意软件需求,而是用户将其作为运行AI智能体(Agent)的无头(headless)服务器,以实现工作流程自动化。这一趋势的核心是开源框架OpenCla...
Read More近日,Hugging Face发布深度博文,系统回顾了自“DeepSeek时刻”以来全球开源人工智能生态的发展轨迹。文章指出,以DeepSeek为代表的开源模型发布事件,标志着AI发展进入了一个由开放协作驱动的新阶段。该文深入剖析了...
Read More一项最新研究显示,通过对开源大语言模型进行高效的微调,其性能可以超越顶尖的闭源模型。研究团队采用直接偏好优化方法,仅使用5400对偏好数据对GPT-OSS 120B模型进行训练,使其在RewardBench 2评估基准的人类偏好...
Read More近日,开源AI助手平台OpenClaw正式发布,标志着从早期ClawdBot到Moltbot的演进进入新阶段。该平台的核心设计理念是隐私与用户控制,其作为开源项目,允许用户在本地机器上部署和运行,从而确保数据处理的私密性。平...
Read More近日,GitHub上出现了一个名为AionUi的开源项目,它旨在解决当前分散的AI命令行工具在协作与使用体验上的痛点。AionUi本质上是一个统一的图形用户界面(GUI),扮演着“协同工作”(Cowork)平台的角色。它能够自动检...
Read More在开源人工智能社区中,PDF文档长期以来被视为一座未被充分挖掘的高质量数据金矿。近日,Hugging Face团队正式发布了其开创性的预训练数据集项目——FinePDFs,成功从海量PDF文档中提取并构建了一个规模超过3万亿令牌...
Read More英伟达今日正式发布了名为Alpamayo的开源AI模型家族,并配套推出了仿真工具与数据集,旨在加速下一代基于推理的安全型自动驾驶系统的开发进程。这一系列模型、数据集和仿真器主要针对自动驾驶领域中的“长尾挑战”——即...
Read More