大模型的相关内容 - 漫话开发者

2026-01-26 talkingdev

开源|TTT-Discover：推理时强化学习新范式，让大模型实时自适应任务

近日，一个名为TTT-Discover的开源项目在GitHub上发布，其核心创新在于将强化学习（Reinforcement Learning）技术应用于大型语言模型（LLMs）的推理（Inference）阶段，而非传统的训练阶段。这一“测试时训练”（Test-...

2026-01-22 talkingdev

根据The Information援引知情人士的报道，知名人工智能公司Anthropic在上个月更新了其财务预测，预计到2025年，通过向企业和应用开发者销售AI服务所获得的毛利率将降至40%。这一数字较此前内部估计的50%出现了显著下...

2026-01-19 talkingdev

埃隆·马斯克旗下的人工智能公司xAI宣布，其名为“Colossus 2”的超级计算机集群已正式投入运行。这一系统被确认为全球首个达到吉瓦（1GW）功率规模的专用人工智能训练集群，标志着AI基础设施竞赛进入了一个新的量级门...

2026-01-16 talkingdev

近日，由D2I-ai团队在GitHub上开源的DASD（序列蒸馏）项目，提出了一种创新的模型蒸馏流程，旨在训练出更紧凑、高效的模型以应对复杂的推理任务。该流程整合了温度调度学习与发散感知采样等前沿技术，通过精细化的知...

2026-01-15 talkingdev

Anthropic公司近期为其Claude Code开发工具推出了一项名为“MCP工具搜索”的重要功能更新。该功能的核心创新在于，它允许Claude Code根据实际需求，动态地将模型上下文协议工具加载到工作上下文中，而非传统的一次性全...

2026-01-09 talkingdev

近日，GitHub上开源了一个名为Sopro的轻量级文本转语音（TTS）模型，其核心亮点在于仅包含1.69亿参数，却实现了零样本语音克隆能力，并能在普通CPU上流畅运行。该项目由开发者samuel-vitorino发布，迅速在技术社区引...

2026-01-06 talkingdev

英伟达创始人兼CEO黄仁勋近日宣布，其下一代AI芯片平台Vera Rubin已进入“全面生产”阶段。根据英伟达官方披露的技术信息，Vera Rubin平台在训练特定大型语言模型时，所需芯片数量可大幅减少至当前旗舰Blackwell架构平...

2025-12-31 talkingdev

软银集团（SoftBank Group Corp.）今日宣布，已完成对人工智能研究公司OpenAI的225亿美元追加投资。此举标志着软银在今年3月承诺的总额高达400亿美元投资计划已全部完成，使其在OpenAI的持股比例达到约11%。这笔巨额...