漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-17 talkingdev

[开源] Visual reasoning models:提升视觉语言模型推理能力的新工具包

近日,GitHub上发布了一个名为'Visual reasoning models'的开源工具包,旨在训练视觉语言模型(VLMs)以提升其基础逻辑和推理能力。该工具包由groundlight团队开发,主要专注于增强模型在处理复杂视觉数据时的理解和...

Read More
2025-03-13 talkingdev

OpenR1 新版本更新:小型模型在竞争性编程中表现优异

Hugging Face 团队近日发布了其 DeepSeek 推理模型的开源复制项目 OpenR1 的最新更新。此次更新揭示了一个有趣的发现:当针对竞争性编程进行专门调优时,小型模型的表现可以超越更大规模的模型。这一发现不仅挑战了...

Read More
2025-03-06 talkingdev

Qwen团队推出QwQ 32B推理模型,性能媲美DeepSeek R1

Qwen团队近日发布了一款名为QwQ 32B的开源推理模型,该模型基于Apache 2.0许可证,性能与DeepSeek R1相当,甚至优于许多更大的蒸馏模型。团队通过结合基于结果的奖励机制、形式化验证和测试用例检查,使模型在数学和...

Read More
2025-02-27 talkingdev

LLM推理能力研究:System 2思维在大型语言模型中的应用

近期,一项针对OpenAI的o1/o3和DeepSeek的R1等推理型LLM的研究揭示了这些模型在逐步逻辑推理能力方面的表现。研究通过对比人类认知能力,对这些模型进行了基准测试。结果显示,尽管LLM在复杂任务中表现出色,但在需...

Read More
2025-02-26 talkingdev

Rabbit展示其AI agent控制Android应用的能力

Rabbit近日展示了其AI agent控制Android应用的能力,实现了其早期R1发布时的承诺。该AI能够执行诸如查找视频和收集鸡尾酒配料等任务,尽管目前仍存在一些效率问题。Rabbit表示将继续优化这一agent,并计划在不久的将...

Read More
2025-02-26 talkingdev

R1-OneVision:多模态推理模型在复杂视觉任务中的突破

近日,R1-OneVision作为一种多功能的大型多模态模型,正式在GitHub上发布。该模型通过整合视觉与文本数据,在数学、科学、深度图像理解及逻辑推理等复杂任务中表现出色。R1-OneVision的设计旨在解决传统单一模态模型...

Read More
2025-02-21 talkingdev

梁文峰与DeepSeek的开源AI探索之旅

梁文峰,一位对冲基金经理,推出了自筹资金的开源AI平台DeepSeek,该平台因其创新的LLM(如DeepSeek-R1)而迅速获得全球关注,这些模型可与OpenAI的模型相媲美。DeepSeek采用更具成本效益的训练方法,并兼容消费级硬...

Read More
2025-02-17 talkingdev

R1展示思维链动画,揭秘AI思考过程

近日,R1通过展示其思维链动画,向公众揭示了AI的思考过程。这一创新展示不仅让用户直观地看到R1如何处理信息,还展示了其如何通过复杂的逻辑链条进行决策。R1的思维链动画通过动态的视觉效果,清晰地展示了从输入到...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page