OpenAI近期披露了一项引人注目的内部实验成果。在该项目中,一个小型团队成功发布了一款产品,其整个代码库——包括应用逻辑、测试用例、持续集成(CI)流程、技术文档以及相关工具链——均由Codex智能体(agents)自主...
Read More近日,月之暗面(Moonshot AI)旗下智能助手Kimi正式推出了一项名为“Agent Swarm”(智能体集群)的前沿功能,标志着AI从单一任务执行向复杂、结构化协作迈出了关键一步。该功能被形象地比喻为一位“AI CEO”,能够自主...
Read MoreMeta(原Facebook)旗下研究团队近日在GitHub开源了AIRS-Bench基准测试框架,旨在系统性地量化大型语言模型(LLM)代理在真实世界人工智能研究任务中的端到端能力。该基准包含20个精心设计的机器学习研究任务,每个...
Read More人工智能开源社区Hugging Face近日在NPM上发布了Transformers.js v4的预览版本,标志着在Web端及JavaScript生态系统中部署和运行机器学习模型的能力迈入了新的阶段。Transformers.js的核心价值在于允许开发者直接在...
Read More生成式人工智能(Gen-AI)在软件开发领域正引发一场关于效率与协作的深刻反思。最新观点指出,尽管AI工具可能在短期内提升个体开发者的编码速度,但其产生的“负外部性”正悄然侵蚀软件团队的协作根基。核心问题首先体...
Read More近日,知名Python数据验证库Pydantic团队在GitHub上开源了一个名为Monty的项目,这是一个用Rust编写的、极简且安全的Python解释器,专为人工智能应用场景设计。该项目旨在解决一个关键痛点:如何安全地执行由大型语...
Read More近期,AI研究领域围绕开源与闭源模型的发展路径展开了激烈讨论。专家Nathan Lambert提出一个核心论断:开源模型在性能上可能永远无法完全追上闭源模型。这并非意味着开源模式失败,而是揭示了其独特的战略价值。闭源...
Read MoreCursor公司近日宣布,将其多智能体研究工具的一部分以预览形式向公众开放。这项研究展示了一个突破性进展:数千个AI智能体在极少人工干预的情况下,协同编码并成功构建了一个功能完整的网页浏览器。这一实验不仅验证...
Read More