漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

DeepReinforce近日开源了其新一代编程模型家族Ornith-1.0,这一系列模型的最大亮点在于具备自我编写强化学习(RL)训练框架的能力,标志着AI模型在自我优化和自动化研究方向上迈出重要一步。Ornith-1.0家族基于预训练的Gemma 4和Qwen 3.5基础模型构建,每个变体都在此之上进行了针对性训练,使其在同类开源模型中达到了最先进的性能水平。在多个标准编程基准测试中,Ornith-1.0的表现直接对标闭源顶级模型Claude Opus 4.7,展示了开源模型追赶并超越专有模型的强劲势头。DeepReinforce已在Hugging Face上公开了模型权重和技术报告,供研究团队和开发者直接下载、运行或进行深入分析。这一开源举动不仅降低了前沿编程模型的使用门槛,也为社区探索模型自我改进和自动化RL训练提供了宝贵资源,预计将对AI编程、自动化软件开发和强化学习研究领域产生深远影响。

核心要点

  • DeepReinforce开源Ornith-1.0编程模型家族,支持自我编写强化学习训练框架。
  • 模型基于Gemma 4和Qwen 3.5基础模型,在开源模型中达到最先进水平。
  • 性能与Claude Opus 4.7相当,模型权重和技术报告已在Hugging Face公开。

Read more >