优化模型的相关内容 - 漫话开发者

2026-05-28 talkingdev

AI程序员Devin再获巨额融资，Cognition估值飙升至260亿美元

人工智能软件工程师Devin的开发商Cognition近日宣布完成超过10亿美元的新一轮融资，公司估值达到260亿美元。本轮融资由Lux Capital、General Catalyst和8VC等知名投资机构领投。Devin作为一款AI驱动的软件工程师，已...

2026-02-08 talkingdev

近日，Anthropic公司为其代码助手Claude Code推出了一项名为“快速模式”的新功能，旨在显著提升其旗舰模型Opus 4.6的响应速度。该功能允许用户在Claude Code界面中通过切换开关，在需要快速获取代码建议或解释时，获...

2026-01-23 talkingdev

谷歌研究团队近日发布了一项关于提升智能体意图理解能力的技术成果。核心观点指出，要让AI智能体真正发挥作用，其底层模型必须精准理解用户交互时的真实意图。当前，大型多模态大语言模型虽已在此任务上表现不俗，但...

2025-11-30 talkingdev

在《麻省理工科技评论》的深度访谈中，谷歌DeepMind诺奖得主John Jumper揭示了AlphaFold超越传统蛋白质结构预测的突破性应用。这位2017年刚获得理论化学博士学位的科学家，如今正引领团队探索AlphaFold在药物设计、...

2025-09-15 talkingdev

这篇技术长文系统性地剖析了大语言模型（LLM）的后训练完整生命周期，涵盖了监督微调（SFT）、奖励建模（Reward Modeling）以及强化学习方法（如RLHF）三大核心阶段。作者不仅详细阐述了如何通过人类反馈的强化学习...

2025-07-08 talkingdev

近日，研究人员发布了新一代商业级大语言模型Mercury，该模型基于扩散模型技术，采用Transformer架构进行参数化，并能够并行预测多个token。报告重点介绍了Mercury Coder，这是首套专为编程应用设计的扩散大语言模型...

2025-06-02 talkingdev

近日，Kiln公司发布了一篇关于大型语言模型(LLM)微调的深度指南，引发了开发者社区的广泛讨论。文章详细探讨了在什么情况下需要对预训练的大型语言模型进行微调，以及如何开始这一过程的技术细节。随着ChatGPT等大模...

2025-05-14 talkingdev

人工智能平台Hugging Face近日发布了一项突破性的语音转录服务——Whisper极速端点（Fast Whisper Endpoint）。这项创新技术通过优化模型架构和计算资源分配，实现了高达8倍的转录速度提升，为语音处理领域树立了新的...