漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-09-30 talkingdev

Anthropic发布Claude Sonnet 4.5:刷新代码生成与智能体开发新标杆

人工智能公司Anthropic正式推出Claude Sonnet 4.5模型,该模型在SWE-bench Verified基准测试中以77.2%的得分刷新世界纪录,成为当前全球最卓越的代码生成模型。此次升级在计算机操作、复杂推理和数学计算三大核心领...

Read More
2025-09-25 talkingdev

Meta发布开源代码与世界建模大模型CWM,探索代码生成新范式

Meta公司最新推出了名为CWM(Code World Model)的开源大语言模型,该模型参数量达320亿,采用仅解码器架构。其创新之处在于训练数据融合了代码执行轨迹与复杂推理任务,旨在构建能够理解代码动态执行过程的‘世界模...

Read More
2025-08-06 talkingdev

OpenAI发布两款开源推理模型:gpt-oss-120b与gpt-oss-20b

OpenAI近日正式推出两款开源权重推理模型gpt-oss-120b和gpt-oss-20b,标志着其在开放生态建设上的重大进展。这两款模型采用Apache 2.0许可证,允许用户自由定制并应用于商业场景,其显著特性包括支持智能体任务处理...

Read More
2025-08-06 talkingdev

开源|MetaStone AI发布第四代开源模型XBai o4,推理性能超越OpenAI-o3-mini

MetaStone AI近日在GitHub上发布了其第四代开源模型XBai o4,该模型在复杂推理任务上表现出色,并在Medium模式下性能超越了OpenAI的o3-mini模型。XBai o4不仅优化了推理能力,还引入了一个可扩展的并行测试时推理框...

Read More
2025-07-09 talkingdev

Hugging Face发布SmolLM3:小型多语言长上下文推理模型

Hugging Face最新推出的SmolLM3是一款完全开源的3B参数语言模型,支持六种语言,具备强大的推理能力和长上下文处理能力。该模型旨在小型模型领域实现高性能,为多语言处理和复杂推理任务提供了新的解决方案。SmolLM3...

Read More
2025-06-27 talkingdev

Meta挖角OpenAI强化学习先驱,加速超级智能研发

据最新报道,Meta已秘密招募OpenAI前强化学习专家Trapit Bansal加入其新成立的AI超级智能部门。这一动作虽未获官方确认,但业内人士分析指出,Bansal的加盟将显著提升Meta在前沿推理模型领域的研发能力。作为深度强...

Read More
2025-06-26 talkingdev

高效推理新方法-Continuous Concise Hints技术开源

近期GitHub上开源的ConciseHint项目提出了一种创新的大语言模型推理优化技术。该技术通过在生成过程中注入学习或手工设计的简洁提示,能够在保持模型性能的前提下显著提升推理过程的简洁性。这一突破性方法解决了当...

Read More
2025-06-09 talkingdev

苹果研究揭示大型推理模型的思维假象:高复杂度下性能崩溃

苹果公司研究团队通过定制化谜题环境对大型推理模型(LRMs)进行了系统性评估,揭示了人工智能推理能力的重要局限性。研究发现,随着任务复杂度提升,LRMs会经历推理效能先上升后急剧下降的拐点现象,最终在高度复杂任...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page