LLaVa模型是一个开源模型,结合了语言和视觉。这个新版本允许使用图像编辑、生成等工具来进行指导,调整模型。LLaVa Plus模型提供了更高的精度和更好的性能。
Read More本文介绍了SALMONN,这是一种独特的AI模型,它将文本理解与处理各种音频输入(从语音到音乐)的能力相结合。 SALMONN不仅在训练过的音频任务(如语音识别)中表现出色,而且展示了令人印象深刻的新技能,例如将语音...
Read More谷歌的DeepMind与33个研究所联手,共同开发了名为Open X-Embodiment的数据库,这个数据库相当于计算机视觉中的ImageNet数据库。这个数据库包含来自22种机器人类型的500多个技能和150,000个任务,旨在通过提供共享资...
Read MoreCapsule是一款强大的视频编辑器,它利用人工智能技术为内容和营销团队提供高效的视频编辑服务。这款产品能够以更快的速度处理视频内容,无需专业的视频编辑技能,用户就能轻松制作出专业级别的视频。Capsule的智能算...
Read More近日,一个针对提升机器学习(ML)工程能力的深度资源在GitHub上获得了大量关注。这个资源提供了一系列详细的指南和建议,可以帮助工程师在机器学习领域提升技能水平。它包括了从基础理论到实际应用的各个方面,旨在...
Read MoreGoogle开发了一种名为OPRO(Optimization by PROmpting)的技术,通过人类风格的鼓励,如“让我们一步一步思考”,来提高LLMs的数学技能。这种方法实际上是在AI的计算过程中注入了人类的思维方式,使其在解决问题时更...
Read More丰田研究所(TRI)正在展示其在研究进展中如何在一夜之间教授机器人新技能。TRI运用传统的机器人学习技术和类似于生成AI模型的扩散模型。其系统已经针对60种技能进行了训练,主要关注在不同环境中的多功能性,目标是制...
Read MoreChartGenAI,一款新型的AI图表生成产品,它可以让用户通过一句话就能生成任何想要的图表。这一突破性的技术,极大地提升了数据可视化的便捷性。用户无需任何复杂的编程知识,只需简洁明了地描述你想要的图表样式和数...
Read More这项研究探讨了大型语言模型(LLMs)解决数学问题的能力,及各种不同因素如何影响它们的能力。研究人员发现,一种名为“拒绝采样精细调整”(Rejection sampling Fine-Tuning, RFT)的方法有助于这些模型在数学上的提...
Read More