推理模型的相关内容 - 漫话开发者

2026-07-28 talkingdev

Cogent发布前沿网络推理模型VR-1，自主渗透测试能力翻倍

人工智能安全公司Cogent推出了其最新的前沿网络推理模型VR-1，该模型经过专门的后训练，能够自主探查陌生企业环境、组合跨系统弱点，并通过实际执行验证攻击路径。VR-1的核心能力在于模拟真实攻击链：从有限初始访问...

2026-05-21 talkingdev

OpenAI的一个推理模型成功推翻了离散几何学中的核心猜想——“平面单位距离问题”（Planar Unit Distance Problem）。该猜想最早由20世纪著名数学家保罗·埃尔德什于1946年提出，在长达80年的时间里一直未被攻克，是离散...

2026-05-05 talkingdev

OpenAI近日详细披露了其用于全球规模实时语音交互的低延迟基础设施架构。该架构基于重新设计的WebRTC协议，核心采用了分体中继（split relay）和收发器（transceiver）模型。通过将传统WebRTC的单一媒体传输路径拆解...

2026-04-09 talkingdev

Meta公司近日正式推出了名为Muse Spark的新型多模态推理模型，标志着其在追求个人超级智能（Personal Superintelligence）的道路上迈出了关键一步。该模型集成了三大前沿技术能力：工具使用、视觉思维链以及多智能体...

2026-04-03 talkingdev

谷歌DeepMind正式推出了新一代开源模型系列Gemma 4，该系列模型基于其旗舰模型Gemini 3的研究成果构建，被官方称为“迄今为止最智能的开源模型”。Gemma 4的核心优化方向聚焦于复杂的推理能力和智能体（Agent）工作流...

2026-04-02 talkingdev

人工智能公司Arcee AI近日正式发布了其前沿开源推理模型“Trinity-Large-Thining”。该模型专为处理复杂、长程任务的智能体（Agent）以及多轮工具调用场景而设计，被业界认为是目前中国境外发布的最强大的开源模型之一...

2026-03-27 talkingdev

近日，一位开发者展示了一项颇具创意的低成本AI部署方案。该项目将两个AI智能体分别部署在独立的服务器上，构建了一个分层、高效的交互系统。公开智能体“nullclaw”是一个仅678KB的Zig语言二进制程序，运行内存约1MB...

2026-01-16 talkingdev

近日，由D2I-ai团队在GitHub上开源的DASD（序列蒸馏）项目，提出了一种创新的模型蒸馏流程，旨在训练出更紧凑、高效的模型以应对复杂的推理任务。该流程整合了温度调度学习与发散感知采样等前沿技术，通过精细化的知...