人工智能研究公司Anthropic正式推出Claude Opus 4和Claude Sonnet 4两大模型,在编码能力、高级推理及AI智能体领域设立全新行业标准。此次升级的核心突破在于模型针对复杂长时任务的设计优化,可持续运行数小时完成...
Read MoreOpenAI以65亿美元股权全资收购了与苹果前设计总监Jony Ive共同创立的合资公司io,标志着这家AI巨头正式进军硬件领域。此次收购不仅涉及巨额资金,更凸显了OpenAI从纯软件向软硬结合的战略转型。Jony Ive作为主导iPho...
Read More谷歌高被引研究员Kevin Murphy近期更新了其200页的强化学习权威教材,系统性地覆盖了从传统方法到直接偏好优化(DPO)、广义策略优化(GPRO)以及推理技术等最前沿进展。该教材作为领域内的标杆性文献,不仅整合了经...
Read More谷歌于12月启动封闭测试后,现已正式向公众发布其AI编程工具Jules。这款基于Gemini 2.5大模型构建的工具能够克隆整个代码仓库,并在开发者处理其他任务时自主完成编写测试、修复漏洞和构建新功能等工作。当前AI编程...
Read More在人工智能领域,通用大模型(LLMs)虽然功能强大,但对于特定任务而言,其庞大的计算资源消耗和较高的成本并不总是最优选择。为此,Fastino公司推出了专精任务的语言模型(TLMs),旨在为特定任务提供更高效、更精...
Read MoreGitHub最新开源项目展示了一种针对Qwen2.5B大语言模型的创新微调方案,该方案采用SFT(监督微调)结合GRPO(梯度反向传播优化)的混合训练框架,其技术路线受到DeepSeek R1架构启发,并针对AWS云平台进行了专项优化...
Read More人工智能领域迎来重大技术突破,开源项目ParScale通过创新性地在大型语言模型(LLM)的训练和推理阶段同时应用并行计算技术,成功建立了第三种LLM扩展范式。这一技术突破解决了传统序列计算模式在超大规模模型应用中...
Read More在被OpenAI收购后,Windsurf正式推出全新编程专用模型家族:旗舰级SWE-1(性能对标Claude Sonnet 3.5)、无使用限制的SWE-1-lite以及轻量版SWE-1-mini。该公司宣称,这些基于非完整代码状态和多工作界面训练的专业模...
Read More