漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-02-08 talkingdev

Claude Code推出快速模式,显著提升Opus 4.6代码助手响应速度

近日,Anthropic公司为其代码助手Claude Code推出了一项名为“快速模式”的新功能,旨在显著提升其旗舰模型Opus 4.6的响应速度。该功能允许用户在Claude Code界面中通过切换开关,在需要快速获取代码建议或解释时,获...

Read More
2026-01-23 talkingdev

小模型大作为:谷歌提出分解法,实现更优意图理解,兼顾效率与隐私

谷歌研究团队近日发布了一项关于提升智能体意图理解能力的技术成果。核心观点指出,要让AI智能体真正发挥作用,其底层模型必须精准理解用户交互时的真实意图。当前,大型多模态大语言模型虽已在此任务上表现不俗,但...

Read More
2025-11-30 talkingdev

专访诺奖得主John Jumper:AlphaFold的创造性“超范围应用”与LLM融合前瞻

在《麻省理工科技评论》的深度访谈中,谷歌DeepMind诺奖得主John Jumper揭示了AlphaFold超越传统蛋白质结构预测的突破性应用。这位2017年刚获得理论化学博士学位的科学家,如今正引领团队探索AlphaFold在药物设计、...

Read More
2025-09-15 talkingdev

LLM后训练全流程深度解析:从SFT到RLHF与评估最佳实践

这篇技术长文系统性地剖析了大语言模型(LLM)的后训练完整生命周期,涵盖了监督微调(SFT)、奖励建模(Reward Modeling)以及强化学习方法(如RLHF)三大核心阶段。作者不仅详细阐述了如何通过人类反馈的强化学习...

Read More
2025-07-08 talkingdev

[论文推荐] Mercury:基于扩散模型的超高速语言模型

近日,研究人员发布了新一代商业级大语言模型Mercury,该模型基于扩散模型技术,采用Transformer架构进行参数化,并能够并行预测多个token。报告重点介绍了Mercury Coder,这是首套专为编程应用设计的扩散大语言模型...

Read More
2025-06-02 talkingdev

开发者指南:何时需要对大型语言模型进行微调?

近日,Kiln公司发布了一篇关于大型语言模型(LLM)微调的深度指南,引发了开发者社区的广泛讨论。文章详细探讨了在什么情况下需要对预训练的大型语言模型进行微调,以及如何开始这一过程的技术细节。随着ChatGPT等大模...

Read More
2025-05-14 talkingdev

HF推出Whisper极速转录服务,速度提升8倍

人工智能平台Hugging Face近日发布了一项突破性的语音转录服务——Whisper极速端点(Fast Whisper Endpoint)。这项创新技术通过优化模型架构和计算资源分配,实现了高达8倍的转录速度提升,为语音处理领域树立了新的...

Read More
2025-05-10 talkingdev

Nao Labs推出AI代码编辑器nao:专为数据工作流打造

Nao Labs近日发布了其AI代码编辑器nao,这是一款专为数据工作流设计的工具,直接连接数据仓库,并配备了内置数据模式上下文的AI助手。nao基于VS Code开发,支持BigQuery、Snowflake和Postgres等数据仓库,通过RAG技...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page