近日,一个名为Letta Code的开源项目在GitHub上发布,它代表了一种新型AI编程代理的设计范式。该项目旨在构建一个“记忆优先”的编程框架,专为能够跨会话持久存在的长期智能体而设计。与传统的、每次对话都从零开始的...
Read More近日,一个名为Multica的开源基础设施平台在GitHub上发布,旨在将AI编程智能体深度集成到软件开发团队中,使其成为能够自主认领任务、编写代码并汇报进度的“真实队友”。该平台采用Go语言构建的架构,通过本地守护进...
Read More在人工智能系统日益复杂的今天,多智能体协同架构的设计成为提升系统可靠性与效率的关键。最新技术分析揭示了五种核心协调模式及其适用场景。其中,生成-验证模式通过将任务执行与质量控制分离,专门解决特定可靠性...
Read More埃隆·马斯克旗下的人工智能公司xAI正在为其即将推出的代码生成平台Grok Build开发一套基于积分的定价模型。该平台将同时提供本地命令行界面和远程网页界面,旨在为开发者提供灵活的开发环境。Grok Build的核心创新之...
Read More加州大学伯克利分校的研究团队近日发表博客文章,详细阐述了他们在构建可信赖的AI智能体基准测试方面取得的突破性进展。文章指出,当前许多流行的AI智能体基准测试存在设计缺陷,容易被特定策略“破解”或产生误导性结...
Read More近期,一项针对Claude Code Review系统的实际测试揭示了其在自动化代码审查领域的最新进展与应用潜力。该系统采用创新的多智能体并行处理架构,通过多个专门化智能体协同工作,对代码进行多轮验证,并设定80%置信度...
Read More近日,一个名为Skrun的开源项目在GitHub上发布,为AI智能体(Agent)的部署与应用提供了新的解决方案。该项目核心在于能够将任何“智能体技能”封装并部署为可通过标准POST /run接口调用的API服务。其技术亮点包括对多...
Read More近日,GitHub上开源了一个名为Claw-Eval的评估框架,专门用于评估大型语言模型作为智能体的能力。该框架的核心价值在于其构建了一个全面且经过人类验证的基准测试集,涵盖了139项多样化的真实世界任务。与以往许多依...
Read More