DeepReinforce开源Ornith-1.0编程模型：能自我编写强化学习框架，性能比肩Claude Opus 4.7

talkingdev • 2026-06-26

1323 views

DeepReinforce近日开源了其新一代编程模型家族Ornith-1.0，这一系列模型的最大亮点在于具备自我编写强化学习（RL）训练框架的能力，标志着AI模型在自我优化和自动化研究方向上迈出重要一步。Ornith-1.0家族基于预训练的Gemma 4和Qwen 3.5基础模型构建，每个变体都在此之上进行了针对性训练，使其在同类开源模型中达到了最先进的性能水平。在多个标准编程基准测试中，Ornith-1.0的表现直接对标闭源顶级模型Claude Opus 4.7，展示了开源模型追赶并超越专有模型的强劲势头。DeepReinforce已在Hugging Face上公开了模型权重和技术报告，供研究团队和开发者直接下载、运行或进行深入分析。这一开源举动不仅降低了前沿编程模型的使用门槛，也为社区探索模型自我改进和自动化RL训练提供了宝贵资源，预计将对AI编程、自动化软件开发和强化学习研究领域产生深远影响。

核心要点

DeepReinforce开源Ornith-1.0编程模型家族，支持自我编写强化学习训练框架。
模型基于Gemma 4和Qwen 3.5基础模型，在开源模型中达到最先进水平。
性能与Claude Opus 4.7相当，模型权重和技术报告已在Hugging Face公开。

DeepReinforce开源Ornith-1.0编程模型：能自我编写强化学习框架，性能比肩Claude Opus 4.7

核心要点

Related posts