Meta(原Facebook)旗下研究团队近日在GitHub开源了AIRS-Bench基准测试框架,旨在系统性地量化大型语言模型(LLM)代理在真实世界人工智能研究任务中的端到端能力。该基准包含20个精心设计的机器学习研究任务,每个...
Read MoreRowboat是一款开源、本地优先的AI协作者应用,其核心创新在于将用户的工作内容动态转化为可生长的知识图谱,并基于此图谱执行实际任务。该系统由两大模块构成:一是“活上下文图谱”,通过连接Gmail、Granola、Firefli...
Read More生成式人工智能(Gen-AI)在软件开发领域正引发一场关于效率与协作的深刻反思。最新观点指出,尽管AI工具可能在短期内提升个体开发者的编码速度,但其产生的“负外部性”正悄然侵蚀软件团队的协作根基。核心问题首先体...
Read MoreGitHub近日正式推出Agentic Workflows,这是一项旨在深度集成于GitHub Actions平台、通过AI编码代理实现代码库自动化管理的前沿功能。用户无需编写复杂的YAML脚本,仅需使用Markdown文件以自然语言描述期望的自动化...
Read More近日,知名Python数据验证库Pydantic团队在GitHub上开源了一个名为Monty的项目,这是一个用Rust编写的、极简且安全的Python解释器,专为人工智能应用场景设计。该项目旨在解决一个关键痛点:如何安全地执行由大型语...
Read More人工智能研究公司Anthropic正式发布了其旗舰模型Claude Opus的最新版本——Claude Opus 4.6。此次升级标志着大语言模型在专业应用领域的能力边界再次被拓展。该模型在智能体编码、计算机使用、工具调用、信息检索及金...
Read More人工智能安全与研究公司Anthropic近日公布了一项突破性的AI协作编程实验成果。该公司组建了一个由16个并行运行的Claude Opus 4.6智能体组成的“AI开发团队”,成功自主构建了一个基于Rust语言的C编译器。这个由AI团队...
Read More人工智能研究公司Anthropic近期公布了一项引人注目的技术实验成果:通过协调多个Claude AI智能体并行协作,成功构建了一个基于Rust语言的C语言编译器。该编译器已具备编译最新Linux 6.9内核的能力,标志着AI在复杂系...
Read More