漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-04-13 talkingdev

开源|Multica:将AI编程智能体转化为真实开发队友的开源平台

近日,一个名为Multica的开源基础设施平台在GitHub上发布,旨在将AI编程智能体深度集成到软件开发团队中,使其成为能够自主认领任务、编写代码并汇报进度的“真实队友”。该平台采用Go语言构建的架构,通过本地守护进...

Read More
2026-04-13 talkingdev

xAI为即将发布的Grok Build引入积分定价系统,挑战代码生成工具市场格局

埃隆·马斯克旗下的人工智能公司xAI正在为其即将推出的代码生成平台Grok Build开发一套基于积分的定价模型。该平台将同时提供本地命令行界面和远程网页界面,旨在为开发者提供灵活的开发环境。Grok Build的核心创新之...

Read More
2026-04-12 talkingdev

我们如何打破顶级AI智能体基准测试?加州伯克利团队揭示可信基准构建之道

加州大学伯克利分校的研究团队近日发表博客文章,详细阐述了他们在构建可信赖的AI智能体基准测试方面取得的突破性进展。文章指出,当前许多流行的AI智能体基准测试存在设计缺陷,容易被特定策略“破解”或产生误导性结...

Read More
2026-04-09 talkingdev

开源|Skrun:将任意智能体技能部署为API的开源平台,支持多模型与状态记忆

近日,一个名为Skrun的开源项目在GitHub上发布,为AI智能体(Agent)的部署与应用提供了新的解决方案。该项目核心在于能够将任何“智能体技能”封装并部署为可通过标准POST /run接口调用的API服务。其技术亮点包括对多...

Read More
2026-04-09 talkingdev

开源|Claw-Eval:首个经人类验证的LLM智能体基准测试集,覆盖139项真实任务

近日,GitHub上开源了一个名为Claw-Eval的评估框架,专门用于评估大型语言模型作为智能体的能力。该框架的核心价值在于其构建了一个全面且经过人类验证的基准测试集,涵盖了139项多样化的真实世界任务。与以往许多依...

Read More
2026-04-09 talkingdev

Meta发布Muse Spark:迈向个人超级智能的多模态推理与工具调用新模型

Meta公司近日正式推出了名为Muse Spark的新型多模态推理模型,标志着其在追求个人超级智能(Personal Superintelligence)的道路上迈出了关键一步。该模型集成了三大前沿技术能力:工具使用、视觉思维链以及多智能体...

Read More
2026-04-07 talkingdev

开源|Hippo Memory:受海马体启发的AI记忆系统,让智能体告别“健忘症”

近日,一个名为Hippo Memory的开源项目在GitHub上发布,旨在为AI智能体构建一个受生物学启发的记忆系统,以解决其在长期交互中遗忘关键上下文信息的核心难题。该项目灵感来源于人类大脑中的海马体,通过模拟记忆衰减...

Read More
2026-04-07 talkingdev

开源|Ghost Pepper:macOS本地长按语音转文字工具,基于WhisperKit与本地LLM,数据不出设备

开发者matthartman近日在GitHub上开源了名为Ghost Pepper的macOS应用,它是一款完全在本地运行的“长按说话”语音转文字工具。该工具的核心技术栈结合了OpenAI开源的WhisperKit语音识别模型与本地运行的大型语言模型(...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page