漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-01-24 talkingdev

深度解析:OpenAI揭秘Codex智能体循环机制,AI自主决策能力再进一步

OpenAI技术团队成员Michael Bolin近期发表了一篇题为《Unrolling the Codex agent loop》的技术文章,深入剖析了基于Codex模型的智能体(Agent)在执行复杂任务时的内部循环机制。该文章揭示了AI智能体如何通过“感知...

Read More
2026-01-23 talkingdev

Clerk MCP Server公测版发布:为AI编程助手注入精准SDK知识库,提升开发效率

近日,专注于开发者工具与身份验证服务的Clerk公司正式推出其MCP Server的公测版本。该产品标志着AI辅助编程领域向更深层次的工具集成与知识专业化迈出了关键一步。Clerk MCP Server的核心价值在于,它作为一个标准...

Read More
2026-01-23 talkingdev

模型大作为:谷歌提出分解法,实现更优意图理解,兼顾效率与隐私

谷歌研究团队近日发布了一项关于提升智能体意图理解能力的技术成果。核心观点指出,要让AI智能体真正发挥作用,其底层模型必须精准理解用户交互时的真实意图。当前,大型多模态大语言模型虽已在此任务上表现不俗,但...

Read More
2026-01-23 talkingdev

开源|通义千问Qwen3-TTS系列全面开源:支持语音克隆、音色设计与多语言生成

阿里云旗下通义千问团队正式宣布,其Qwen3-TTS系列语音生成模型现已全面开源。该系列模型代表了当前语音合成领域的前沿技术水平,集成了语音克隆、音色设计、超高拟人度语音生成以及基于自然语言的语音控制等核心功...

Read More
2026-01-22 talkingdev

AI成本压力显现:Anthropic大幅下调2025年毛利率预期至40%,因推理成本飙升

根据The Information援引知情人士的报道,知名人工智能公司Anthropic在上个月更新了其财务预测,预计到2025年,通过向企业和应用开发者销售AI服务所获得的毛利率将降至40%。这一数字较此前内部估计的50%出现了显著下...

Read More
2026-01-20 talkingdev

开源|Tambo AI:基于React的生成式UI SDK,用自然语言交互驱动界面动态适配

近日,开源项目Tambo AI在GitHub上发布,这是一个专为React框架设计的生成式用户界面软件开发工具包。该SDK的核心创新在于,它允许开发者构建能够根据自然语言交互动态适应用户需求的应用程序。其工作原理是,开发者...

Read More
2026-01-20 talkingdev

开源|Gemini Voyager:为谷歌Gemini打造的全能增强套件,集成对话导航与提示库管理

近日,一个名为Gemini Voyager的开源浏览器扩展项目在GitHub上发布,旨在显著提升用户与谷歌Gemini大语言模型交互的体验与效率。该项目并非简单的界面美化工具,而是一个集成了多项高级组织与实用功能的增强套件,直...

Read More
2026-01-20 talkingdev

开源|Meta发布ShapeR:从图像序列生成完整3D场景网格

Meta AI研究院近日在GitHub开源了ShapeR项目,该项目代表了3D场景重建领域的一项重要进展。ShapeR的核心技术在于能够仅从一系列图像中,重建出完整的、高质量的三维场景网格。其技术路径颇具创新性:首先,系统从输...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page