漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-04-13 talkingdev

开源|Letta Code:记忆优先的AI编程伙伴,让代码助手成为“永久队友”

近日,一个名为Letta Code的开源项目在GitHub上发布,它代表了一种新型AI编程代理的设计范式。该项目旨在构建一个“记忆优先”的编程框架,专为能够跨会话持久存在的长期智能体而设计。与传统的、每次对话都从零开始的...

Read More
2026-04-13 talkingdev

开源|Multica:将AI编程智能体转化为真实开发队友的开源平台

近日,一个名为Multica的开源基础设施平台在GitHub上发布,旨在将AI编程智能体深度集成到软件开发团队中,使其成为能够自主认领任务、编写代码并汇报进度的“真实队友”。该平台采用Go语言构建的架构,通过本地守护进...

Read More
2026-04-13 talkingdev

智能体协同五大模式解析:从生成-验证到事件驱动,如何选择最优架构?

在人工智能系统日益复杂的今天,多智能体协同架构的设计成为提升系统可靠性与效率的关键。最新技术分析揭示了五种核心协调模式及其适用场景。其中,生成-验证模式通过将任务执行与质量控制分离,专门解决特定可靠性...

Read More
2026-04-13 talkingdev

xAI为即将发布的Grok Build引入积分定价系统,挑战代码生成工具市场格局

埃隆·马斯克旗下的人工智能公司xAI正在为其即将推出的代码生成平台Grok Build开发一套基于积分的定价模型。该平台将同时提供本地命令行界面和远程网页界面,旨在为开发者提供灵活的开发环境。Grok Build的核心创新之...

Read More
2026-04-12 talkingdev

我们如何打破顶级AI智能体基准测试?加州伯克利团队揭示可信基准构建之道

加州大学伯克利分校的研究团队近日发表博客文章,详细阐述了他们在构建可信赖的AI智能体基准测试方面取得的突破性进展。文章指出,当前许多流行的AI智能体基准测试存在设计缺陷,容易被特定策略“破解”或产生误导性结...

Read More
2026-04-09 talkingdev

实测Claude代码审查:多智能体并行分析,精准捕捉关键漏洞与潜在风险

近期,一项针对Claude Code Review系统的实际测试揭示了其在自动化代码审查领域的最新进展与应用潜力。该系统采用创新的多智能体并行处理架构,通过多个专门化智能体协同工作,对代码进行多轮验证,并设定80%置信度...

Read More
2026-04-09 talkingdev

开源|Skrun:将任意智能体技能部署为API的开源平台,支持多模型与状态记忆

近日,一个名为Skrun的开源项目在GitHub上发布,为AI智能体(Agent)的部署与应用提供了新的解决方案。该项目核心在于能够将任何“智能体技能”封装并部署为可通过标准POST /run接口调用的API服务。其技术亮点包括对多...

Read More
2026-04-09 talkingdev

开源|Claw-Eval:首个经人类验证的LLM智能体基准测试集,覆盖139项真实任务

近日,GitHub上开源了一个名为Claw-Eval的评估框架,专门用于评估大型语言模型作为智能体的能力。该框架的核心价值在于其构建了一个全面且经过人类验证的基准测试集,涵盖了139项多样化的真实世界任务。与以往许多依...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page