漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-14 talkingdev

OpenAI即将推出升级版GPT-4.1及全尺寸推理模型

OpenAI正在准备发布GPT-4.1及其o3推理模型的完整版本。GPT-4.1是对GPT-4o的重新设计版本,并计划推出更小尺寸的mini和nano版本。尽管OpenAI目前尚未实现盈利,但其当前估值已达到3000亿美元。上个月,ChatGPT成为应...

Read More
2025-04-08 talkingdev

AI先驱Cyc项目落幕:知识表示时代的终结与反思

历经38年研发的知识表示系统Cyc项目近日正式终止,标志着人工智能发展史上一个重要篇章的完结。由Douglas Lenat于1984年创立的Cyc项目,旨在通过人工编码的常识知识库实现机器推理能力,其知识库最终包含超过2500万...

Read More
2025-04-07 talkingdev

谷歌Gemini 2.5 Pro开放公测:AI Studio抢先体验,Vertex AI即将支持

谷歌宣布其新一代多模态大模型Gemini 2.5 Pro正式进入公测阶段,开发者现可通过Google AI Studio的Gemini API进行体验,而企业级平台Vertex AI的支持也即将上线。作为Gemini系列的最强版本,2.5 Pro在跨模态理解、长...

Read More
2025-04-07 talkingdev

[论文推荐]DeepSeek提出推理时缩放技术,革新通用奖励模型训练范式

DeepSeek最新研究论文《Inference-Time Scaling for Generalist Reward Modeling》提出了一种创新方法,通过推理时缩放技术优化奖励模型,从而引导更强大的推理模型生成。该技术标志着这家中国初创公司的一项战略布...

Read More
2025-04-03 talkingdev

[开源]大规模医学推理数据集MedReason发布,推动可解释医疗AI研究

加州大学圣克鲁兹分校视觉、语言与行为实验室(VLAA)在GitHub开源了MedReason项目,这是一个专为提升大语言模型(LLM)医疗推理能力构建的大规模数据集。该数据集通过结构化临床案例、医学知识图谱和多模态数据,旨...

Read More
2025-04-02 talkingdev

[开源]SEED-Bench-R1:基于强化学习的视频理解新基准

腾讯ARC实验室最新发布的SEED-Bench-R1基准测试,为多模态大语言模型(MLLM)在复杂视频任务中的表现提供了系统评估框架。该研究重点关注强化学习(RL)和监督微调(SFT)等后训练方法,揭示了RL在视觉感知任务和数...

Read More
2025-04-02 talkingdev

[论文推荐]Open-Reasoner-Zero:探索基础模型在强化学习推理中的规模化应用

强化学习(RL)领域长期存在一个关键问题:是否需要一个足够强大的基础模型来支持涌现式推理能力的形成?最新研究Open-Reasoner-Zero通过系统性实验验证了基础模型对RL推理的重要作用。该研究在多种规模化的RL训练场...

Read More
2025-04-02 talkingdev

Open Hands推出32B代码模型,在代理编码任务中超越更大规模模型

Open Hands团队最新发布的32B参数代码模型(Open Hands LM-32B)在强化学习(RL)训练框架下,基于Qwen架构实现了突破性进展。该模型在代理编码任务(agentic coding tasks)中的表现已超越许多参数规模更大的竞品,...

Read More
  1. Prev Page
  2. 16
  3. 17
  4. 18
  5. Next Page