漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-01-24 talkingdev

谷歌相册推出AI新功能“Me Meme”,用户可将个人照片一键生成表情包

谷歌近日在其相册应用中推出了一项名为“Me Meme”的全新生成式AI功能,该功能允许用户利用自己的个人照片快速创建个性化表情包。此项功能率先在美国市场推出,标志着生成式人工智能在个人娱乐和内容创作领域的应用进...

Read More
2026-01-24 talkingdev

谷歌收购Common Sense Machines,AI新秀可将2D图像生成3D资产

据The Information报道,谷歌已正式收购位于马萨诸塞州剑桥的初创公司Common Sense Machines。该公司专注于开发生成式人工智能模型,其核心技术在于能够将简单的二维图像高效、准确地转化为可用于游戏、虚拟现实、数...

Read More
2026-01-24 talkingdev

深度解析:OpenAI揭秘Codex智能体循环机制,AI自主决策能力再进一步

OpenAI技术团队成员Michael Bolin近期发表了一篇题为《Unrolling the Codex agent loop》的技术文章,深入剖析了基于Codex模型的智能体(Agent)在执行复杂任务时的内部循环机制。该文章揭示了AI智能体如何通过“感知...

Read More
2026-01-23 talkingdev

Clerk MCP Server公测版发布:为AI编程助手注入精准SDK知识库,提升开发效率

近日,专注于开发者工具与身份验证服务的Clerk公司正式推出其MCP Server的公测版本。该产品标志着AI辅助编程领域向更深层次的工具集成与知识专业化迈出了关键一步。Clerk MCP Server的核心价值在于,它作为一个标准...

Read More
2026-01-23 talkingdev

模型大作为:谷歌提出分解法,实现更优意图理解,兼顾效率与隐私

谷歌研究团队近日发布了一项关于提升智能体意图理解能力的技术成果。核心观点指出,要让AI智能体真正发挥作用,其底层模型必须精准理解用户交互时的真实意图。当前,大型多模态大语言模型虽已在此任务上表现不俗,但...

Read More
2026-01-23 talkingdev

开源|通义千问Qwen3-TTS系列全面开源:支持语音克隆、音色设计与多语言生成

阿里云旗下通义千问团队正式宣布,其Qwen3-TTS系列语音生成模型现已全面开源。该系列模型代表了当前语音合成领域的前沿技术水平,集成了语音克隆、音色设计、超高拟人度语音生成以及基于自然语言的语音控制等核心功...

Read More
2026-01-22 talkingdev

AI成本压力显现:Anthropic大幅下调2025年毛利率预期至40%,因推理成本飙升

根据The Information援引知情人士的报道,知名人工智能公司Anthropic在上个月更新了其财务预测,预计到2025年,通过向企业和应用开发者销售AI服务所获得的毛利率将降至40%。这一数字较此前内部估计的50%出现了显著下...

Read More
2026-01-20 talkingdev

开源|Tambo AI:基于React的生成式UI SDK,用自然语言交互驱动界面动态适配

近日,开源项目Tambo AI在GitHub上发布,这是一个专为React框架设计的生成式用户界面软件开发工具包。该SDK的核心创新在于,它允许开发者构建能够根据自然语言交互动态适应用户需求的应用程序。其工作原理是,开发者...

Read More
  1. Prev Page
  2. 48
  3. 49
  4. 50
  5. Next Page