漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-12-18 talkingdev

开源|Chatterbox:支持情感控制与零样本语音克隆的SOTA开源TTS模型发布

近日,由Resemble AI团队在GitHub上开源了名为Chatterbox的文本转语音模型,标志着开源TTS领域迈入了一个新的技术高度。该项目被定位为当前最先进的开源TTS解决方案,其核心亮点在于集成了多语言支持、精细化的情感...

Read More
2025-12-13 talkingdev

苹果macOS 26.2重磅更新:通过Thunderbolt实现RDMA,赋能高速AI计算集群

苹果近日在开发者文档中正式发布了macOS 26.2(代号Tahoe)的更新说明,其中一项关键特性引发了高性能计算与人工智能领域的广泛关注:系统原生支持通过Thunderbolt接口实现远程直接内存访问(RDMA)。这项技术突破意...

Read More
2025-12-12 talkingdev

企业AI应用增长停滞:OpenAI份额下滑,Anthropic与谷歌逆势增长

根据最新市场监测数据,2025年11月企业级人工智能(AI)的采用率稳定在45%,增长势头出现明显停滞。这一现象在金融和科技这两个传统上对新技术最为敏感的行业尤为突出,其采用率甚至出现了轻微下滑。值得关注的是,...

Read More
2025-12-10 talkingdev

开源|智谱AI发布GLM-4.6V系列多模态大模型:原生工具调用与128K上下文窗口

智谱AI近日正式开源了其新一代多模态大模型系列——GLM-4.6V。该系列包含两个关键版本:GLM-4.6V(106B)和GLM-4.6V-Flash(9B)。前者是面向云端和高性能集群场景设计的基础模型,后者则是为本地部署和低延迟应用优化...

Read More
2025-12-09 talkingdev

OpenAI利用稀疏自编码器与潜在归因技术,精准调试语言模型对齐问题

OpenAI的研究团队近期在模型可解释性领域取得重要进展,通过结合稀疏自编码器与创新的潜在归因方法,系统性地定位和解决大型语言模型中的行为错位问题。该研究提出的归因方法能够有效识别稀疏自编码器潜在空间中导致...

Read More
2025-12-05 talkingdev

Hugging Face新技能:Claude AI现已能微调开源大语言模型

Hugging Face平台近日推出了一项名为“Hugging Face Skills”的新功能,该功能赋予了Anthropic公司的Claude AI模型直接微调开源大语言模型的能力。这项技术突破意味着,用户现在可以通过Claude的对话界面,直接提交模...

Read More
2025-12-02 talkingdev

开源|Ghostty 终端编译为 WASM,实现与 xterm.js API 兼容

近日,一个名为 Ghostty 的终端模拟器项目推出了其 Web 版本,该项目通过 WebAssembly 技术将 Ghostty 编译为可在浏览器中运行的格式,并实现了与业界广泛使用的 xterm.js 终端 API 的兼容性。这一进展意味着开发者...

Read More
2025-11-30 talkingdev

NanoPDF:用Gemini Nano Banana模型通过自然语言编辑PDF演示文稿

开发者gavrielc基于谷歌最新Gemini 3 Pro Image模型(代号Nano Banana)推出开源CLI工具Nano PDF,实现了通过自然语言指令直接编辑PDF文档的技术突破。该工具将指定PDF页面转换为图像,结合用户文本提示调用多模态AI...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page