漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-02-04 talkingdev

开源AI生态全景展望:从DeepSeek时刻到AI+时代

近日,Hugging Face发布深度博文,系统回顾了自“DeepSeek时刻”以来全球开源人工智能生态的发展轨迹。文章指出,以DeepSeek为代表的开源模型发布事件,标志着AI发展进入了一个由开放协作驱动的新阶段。该文深入剖析了...

Read More
2026-02-03 talkingdev

开源模型逆袭!GPT-OSS 120B通过DPO微调,在人类偏好对齐任务上超越GPT-5.2

一项最新研究显示,通过对开源大语言模型进行高效的微调,其性能可以超越顶尖的闭源模型。研究团队采用直接偏好优化方法,仅使用5400对偏好数据对GPT-OSS 120B模型进行训练,使其在RewardBench 2评估基准的人类偏好...

Read More
2026-01-31 talkingdev

开源|月之暗面发布最强模型Kimi K2.5技术报告,引发开发者社区热议

近日,国内人工智能公司月之暗面(Moonshot AI)在GitHub上正式发布了其号称“最强大模型”的Kimi K2.5的技术报告。这份技术报告的公开,迅速吸引了全球开发者与AI研究者的高度关注,在知名技术社区Hacker News上获得...

Read More
2026-01-26 talkingdev

开源|字节跳动Seed团队发布Stable-DiffCoder:基于扩散模型的轻量级代码大语言模型

字节跳动Seed团队在GitHub上开源了Stable-DiffCoder项目,这是一个基于扩散模型(Diffusion Model)构建的轻量级代码大语言模型(Code DLLM)家族。该项目创新性地将扩散模型的生成范式引入代码建模领域,通过“块扩...

Read More
2026-01-06 talkingdev

英伟达发布开源AI模型家族Alpamayo,加速基于推理的自动驾驶开发

英伟达今日正式发布了名为Alpamayo的开源AI模型家族,并配套推出了仿真工具与数据集,旨在加速下一代基于推理的安全型自动驾驶系统的开发进程。这一系列模型、数据集和仿真器主要针对自动驾驶领域中的“长尾挑战”——即...

Read More
2026-01-05 talkingdev

前沿AI能力指数揭示:自2023年以来,中国AI模型平均落后美国前沿7个月

根据Epoch AI研究所发布的最新能力指数分析,自2023年以来,所有处于人工智能能力前沿的模型均由美国研发。同期,中国开发的AI模型在能力上平均落后美国前沿水平约7个月,差距最小为4个月,最大可达14个月。这一差距...

Read More
2026-01-01 talkingdev

2025年大语言模型回顾:推理能力突破、AI智能体普及与格局重塑

根据年度回顾分析,2025年是大语言模型(LLM)发展史上具有里程碑意义的一年。核心技术突破体现在模型获得了真正的“推理”能力,使其能够处理复杂的多步骤任务,这直接推动了高性能AI智能体的广泛应用。其中,“编码智...

Read More
2025-12-23 talkingdev

开源模型新突破:MiniMax M2.1正式登陆Kilo平台,多项基准测试超越DeepSeek与Kimi

人工智能开源领域迎来重要进展。知名开源力量MiniMax推出的最新模型M2.1现已正式在Kilo平台上线。根据官方信息,M2.1在多项关键基准测试中表现优异,其性能已超越国内同行DeepSeek和Kimi等知名模型。更值得关注的是...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page