漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-01-24 talkingdev

谷歌相册推出AI新功能“Me Meme”,用户可将个人照片一键生成表情包

谷歌近日在其相册应用中推出了一项名为“Me Meme”的全新生成式AI功能,该功能允许用户利用自己的个人照片快速创建个性化表情包。此项功能率先在美国市场推出,标志着生成式人工智能在个人娱乐和内容创作领域的应用进...

Read More
2026-01-24 talkingdev

谷歌收购Common Sense Machines,AI新秀可将2D图像生成3D资产

据The Information报道,谷歌已正式收购位于马萨诸塞州剑桥的初创公司Common Sense Machines。该公司专注于开发生成式人工智能模型,其核心技术在于能够将简单的二维图像高效、准确地转化为可用于游戏、虚拟现实、数...

Read More
2026-01-24 talkingdev

深度解析:OpenAI揭秘Codex智能体循环机制,AI自主决策能力再进一步

OpenAI技术团队成员Michael Bolin近期发表了一篇题为《Unrolling the Codex agent loop》的技术文章,深入剖析了基于Codex模型的智能体(Agent)在执行复杂任务时的内部循环机制。该文章揭示了AI智能体如何通过“感知...

Read More
2026-01-24 talkingdev

开源|Comma openpilot:开源驾驶辅助系统,为你的汽车注入AI灵魂

近日,由comma.ai开发的开源驾驶辅助系统Openpilot引发了科技社区的高度关注。该系统旨在通过人工智能技术,将普通汽车升级为具备先进辅助驾驶能力的智能座驾,其核心理念是“让驾驶变得更轻松”。Openpilot并非一个简...

Read More
2026-01-23 talkingdev

小模型大作为:谷歌提出分解法,实现更优意图理解,兼顾效率与隐私

谷歌研究团队近日发布了一项关于提升智能体意图理解能力的技术成果。核心观点指出,要让AI智能体真正发挥作用,其底层模型必须精准理解用户交互时的真实意图。当前,大型多模态大语言模型虽已在此任务上表现不俗,但...

Read More
2026-01-23 talkingdev

开源|通义千问Qwen3-TTS系列全面开源:支持语音克隆、音色设计与多语言生成

阿里云旗下通义千问团队正式宣布,其Qwen3-TTS系列语音生成模型现已全面开源。该系列模型代表了当前语音合成领域的前沿技术水平,集成了语音克隆、音色设计、超高拟人度语音生成以及基于自然语言的语音控制等核心功...

Read More
2026-01-23 talkingdev

CopilotKit实战:为LangChain深度智能体构建实时同步前端界面

近日,CopilotKit在其官方博客发布了一篇深度技术教程,详细演示了如何为LangChain最新推出的‘深度智能体’框架构建功能完整的全栈应用。LangChain深度智能体是一种新型结构化多智能体系统,具备跨步骤规划、任务委派...

Read More
2026-01-22 talkingdev

AI代码审查工具Greptile:融合全库上下文,助力NVIDIA等团队合并提速4倍、缺陷捕获提升3倍

随着AI辅助编程工具的普及,代码生成效率大幅提升,但代码审查环节正成为新的瓶颈,传统人工审查易因上下文缺失、规范不统一导致缺陷遗漏和团队协作效率下降。Greptile作为一款前沿的AI代码审查工具,正致力于解决这...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page