漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-01-27 talkingdev

开源|SWE-Pruner:代码智能体上下文剪枝框架,令牌消耗锐减超50%

近日,GitHub开源项目SWE-Pruner提出了一种名为‘任务感知上下文剪枝’的创新框架,旨在显著优化代码智能体(Coding Agents)在处理复杂软件工程任务时的效率与成本。该框架的核心在于,通过一个轻量级模型动态分析与...

Read More
2026-01-26 talkingdev

开源|TTT-Discover:推理时强化学习新范式,让大模型实时自适应任务

近日,一个名为TTT-Discover的开源项目在GitHub上发布,其核心创新在于将强化学习(Reinforcement Learning)技术应用于大型语言模型(LLMs)的推理(Inference)阶段,而非传统的训练阶段。这一“测试时训练”(Test-...

Read More
2026-01-22 talkingdev

AI成本压力显现:Anthropic大幅下调2025年毛利率预期至40%,因推理成本飙升

根据The Information援引知情人士的报道,知名人工智能公司Anthropic在上个月更新了其财务预测,预计到2025年,通过向企业和应用开发者销售AI服务所获得的毛利率将降至40%。这一数字较此前内部估计的50%出现了显著下...

Read More
2026-01-19 talkingdev

马斯克xAI创纪录:全球首个吉瓦级AI训练集群Colossus 2正式上线

埃隆·马斯克旗下的人工智能公司xAI宣布,其名为“Colossus 2”的超级计算机集群已正式投入运行。这一系统被确认为全球首个达到吉瓦(1GW)功率规模的专用人工智能训练集群,标志着AI基础设施竞赛进入了一个新的量级门...

Read More
2026-01-16 talkingdev

开源|DASD:序列蒸馏技术打造高效推理模型,4B/30B版本在代码、数学与科学基准测试中表现强劲

近日,由D2I-ai团队在GitHub上开源的DASD(序列蒸馏)项目,提出了一种创新的模型蒸馏流程,旨在训练出更紧凑、高效的模型以应对复杂的推理任务。该流程整合了温度调度学习与发散感知采样等前沿技术,通过精细化的知...

Read More
2026-01-15 talkingdev

Claude Code引入MCP工具搜索功能,实现动态上下文加载

Anthropic公司近期为其Claude Code开发工具推出了一项名为“MCP工具搜索”的重要功能更新。该功能的核心创新在于,它允许Claude Code根据实际需求,动态地将模型上下文协议工具加载到工作上下文中,而非传统的一次性全...

Read More
2026-01-09 talkingdev

开源|Sopro TTS:仅1.69亿参数,支持零样本语音克隆的轻量级CPU端模型

近日,GitHub上开源了一个名为Sopro的轻量级文本转语音(TTS)模型,其核心亮点在于仅包含1.69亿参数,却实现了零样本语音克隆能力,并能在普通CPU上流畅运行。该项目由开发者samuel-vitorino发布,迅速在技术社区引...

Read More
2026-01-06 talkingdev

英伟达黄仁勋宣布Vera Rubin芯片全面投产:训练部分大模型所需芯片数量仅为Blackwell的四分之一

英伟达创始人兼CEO黄仁勋近日宣布,其下一代AI芯片平台Vera Rubin已进入“全面生产”阶段。根据英伟达官方披露的技术信息,Vera Rubin平台在训练特定大型语言模型时,所需芯片数量可大幅减少至当前旗舰Blackwell架构平...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page