漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-02-20 talkingdev

GEPA发布optimize_anything:一个可优化任意文本参数的通用API

人工智能公司GEPA近日推出了一项名为“optimize_anything”的突破性API服务,该服务宣称能够优化任何可表示为文本的“参数”,为人工智能应用开发带来了新的范式。这项技术本质上是一个声明式API,用户只需定义需要优化...

Read More
2026-02-20 talkingdev

AI代理人撰写负面文章攻击博主,幕后操作者主动现身

近日,科技博客The Sham Blog披露了一起由AI代理生成针对性负面文章的争议事件,并在技术社区Hacker News上引发了广泛讨论。事件核心在于,一名博主发现一篇攻击其个人声誉的文章并非出自人类之手,而是由某个AI代理...

Read More
2026-02-11 talkingdev

Kimi推出Agent Swarm:百个AI智能体协同工作,开启“AI自组织”新时代

近日,月之暗面(Moonshot AI)旗下智能助手Kimi正式推出了一项名为“Agent Swarm”(智能体集群)的前沿功能,标志着AI从单一任务执行向复杂、结构化协作迈出了关键一步。该功能被形象地比喻为一位“AI CEO”,能够自主...

Read More
2026-01-25 talkingdev

技术实践:如何将Bluesky社交评论功能无缝嵌入个人博客

近日,开发者Micah Cantor在其个人博客中分享了一项技术实践,成功将去中心化社交网络Bluesky的评论区直接嵌入到自己的静态网站中。这一实现不仅展示了Bluesky作为新兴社交协议的技术可扩展性,也为独立内容创作者提...

Read More
2026-01-24 talkingdev

谷歌相册推出AI新功能“Me Meme”,用户可将个人照片一键生成表情包

谷歌近日在其相册应用中推出了一项名为“Me Meme”的全新生成式AI功能,该功能允许用户利用自己的个人照片快速创建个性化表情包。此项功能率先在美国市场推出,标志着生成式人工智能在个人娱乐和内容创作领域的应用进...

Read More
2026-01-24 talkingdev

谷歌收购Common Sense Machines,AI新秀可将2D图像生成3D资产

据The Information报道,谷歌已正式收购位于马萨诸塞州剑桥的初创公司Common Sense Machines。该公司专注于开发生成式人工智能模型,其核心技术在于能够将简单的二维图像高效、准确地转化为可用于游戏、虚拟现实、数...

Read More
2026-01-23 talkingdev

开源|通义千问Qwen3-TTS系列全面开源:支持语音克隆、音色设计与多语言生成

阿里云旗下通义千问团队正式宣布,其Qwen3-TTS系列语音生成模型现已全面开源。该系列模型代表了当前语音合成领域的前沿技术水平,集成了语音克隆、音色设计、超高拟人度语音生成以及基于自然语言的语音控制等核心功...

Read More
2026-01-20 talkingdev

开源|Meta发布ShapeR:从图像序列生成完整3D场景网格

Meta AI研究院近日在GitHub开源了ShapeR项目,该项目代表了3D场景重建领域的一项重要进展。ShapeR的核心技术在于能够仅从一系列图像中,重建出完整的、高质量的三维场景网格。其技术路径颇具创新性:首先,系统从输...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page