Open Hands团队最新发布的32B参数代码模型(Open Hands LM-32B)在强化学习(RL)训练框架下,基于Qwen架构实现了突破性进展。该模型在代理编码任务(agentic coding tasks)中的表现已超越许多参数规模更大的竞品,...
Read More近日,Qwen发布了一款名为Qwen Omni 7B的多模态模型,该模型能够原生理解多种不同的模态数据,并以文本或语音的形式进行响应。这一技术的推出标志着人工智能在多模态处理领域迈出了重要一步。Qwen Omni 7B不仅能够处...
Read More近日,Qwen团队发布了一款名为Qwen 2.5 32B的视觉语言模型,该模型不仅具备强大的多模态处理能力,而且完全开源,能够在消费级硬件上高效运行。这一重大突破为AI领域的研究者和开发者提供了更加灵活和便捷的工具,尤...
Read MoreAudio Flamingo 2 是一个基于Qwen架构构建的最新音频理解模型,其独特之处在于几乎完全使用了合成数据进行训练。这一突破性进展不仅提升了模型在音频处理和理解任务中的表现,还展示了合成数据在AI训练中的巨大潜力...
Read More这项研究探索了如何通过强化学习来教授AI语言模型解决数独谜题,特别采用了Group Relative Policy Optimization (GRPO)技术,应用于Qwen 2.5等模型,无需依赖外部数据或更大模型的蒸馏。研究设计了一个多方面的奖励...
Read More最新研究展示了如何通过强化学习技术,使AI语言模型具备解决数独谜题的能力。该研究采用了Group Relative Policy Optimization (GRPO)方法,并在Qwen 2.5等模型上进行了实验,无需依赖外部数据或更大模型的蒸馏。研...
Read More在视频理解领域,大多数模型通常逐帧处理视频数据,这使得处理时间相关的问题变得具有挑战性。STORM模型通过引入Mamba适配器,增加了时间注意力操作,从而显著提升了长视频的理解能力。与Qwen模型相比,STORM在处理...
Read More近日,GitHub上发布了一款名为Spark Text To Speech的语音克隆模型,该模型基于Qwen架构,能够通过文本输入生成高质量的语音。值得注意的是,该模型支持情感提示功能,用户可以通过输入情感指令来调整生成语音的情感...
Read More