阿里巴巴近日推出了专为编程智能体(Coding Agent)优化的开源模型Qwen3-Coder-Next。该模型基于创新的混合专家(Mixture of Experts, MoE)架构构建,旨在显著提升智能体在代码生成与执行环境交互方面的能力。其核...
Read More近日,由zai-org团队在Hugging Face平台开源了GLM-OCR模型,这是一款专为复杂文档理解设计的先进多模态OCR系统。该模型的核心创新在于其精巧的三段式架构:首先,它采用了在大规模图文数据上预训练的CogViT视觉编码...
Read More近日,Hugging Face发布深度博文,系统回顾了自“DeepSeek时刻”以来全球开源人工智能生态的发展轨迹。文章指出,以DeepSeek为代表的开源模型发布事件,标志着AI发展进入了一个由开放协作驱动的新阶段。该文深入剖析了...
Read More一项最新研究显示,通过对开源大语言模型进行高效的微调,其性能可以超越顶尖的闭源模型。研究团队采用直接偏好优化方法,仅使用5400对偏好数据对GPT-OSS 120B模型进行训练,使其在RewardBench 2评估基准的人类偏好...
Read More近日,国内人工智能公司月之暗面(Moonshot AI)在GitHub上正式发布了其号称“最强大模型”的Kimi K2.5的技术报告。这份技术报告的公开,迅速吸引了全球开发者与AI研究者的高度关注,在知名技术社区Hacker News上获得...
Read More字节跳动Seed团队在GitHub上开源了Stable-DiffCoder项目,这是一个基于扩散模型(Diffusion Model)构建的轻量级代码大语言模型(Code DLLM)家族。该项目创新性地将扩散模型的生成范式引入代码建模领域,通过“块扩...
Read More英伟达今日正式发布了名为Alpamayo的开源AI模型家族,并配套推出了仿真工具与数据集,旨在加速下一代基于推理的安全型自动驾驶系统的开发进程。这一系列模型、数据集和仿真器主要针对自动驾驶领域中的“长尾挑战”——即...
Read More根据Epoch AI研究所发布的最新能力指数分析,自2023年以来,所有处于人工智能能力前沿的模型均由美国研发。同期,中国开发的AI模型在能力上平均落后美国前沿水平约7个月,差距最小为4个月,最大可达14个月。这一差距...
Read More