近期,Ada-LEval这一新基准测试的发布,旨在严格评估大型语言模型处理长篇及超长文本的理解能力。随着人工智能技术的不断进步,语言模型在处理文本信息方面的能力也越来越受到关注。Ada-LEval的推出,不仅为研究人员...
Read More策略引导扩散(Policy-Guided Diffusion)是一种新颖的训练代理的方法,适用于离线环境。该技术通过创建与行为和目标策略都非常接近的综合轨迹,从而生成更加真实的训练数据。这不仅有助于提高离线强化学习模型的性...
Read More最新的技术研究表明,Claude 3 Opus AI模型在说服力方面的水平与人类相差无几。该研究通过统计测试和多重比较校正来评估模型的说服力。虽然人类在说服力上略胜一筹,但这一差异在统计上并不显著,这突显了大型、复杂...
Read MoreDreamView近期推出了一项革命性的技术,能够根据文本描述生成3D对象,并支持从多个视角进行详细定制,同时确保物体整体的一致性。这一技术突破为3D设计师和开发者提供了前所未有的便利,使得从概念到实现的过程更加...
Read More谷歌在其Vertex AI平台上公开预览了最新一代生成型AI模型Gemini 1.5 Pro。该模型提供了高达100万个标记的大容量上下文窗口,这使得它能够处理更复杂的文本生成任务,同时保持高效的计算性能。此举进一步展示了谷歌在...
Read More谷歌凭借其在人工智能领域的深度投资,不仅帮助客户训练和部署前沿的语言模型,更使得公司站在了AI平台变革的前沿。本文深入探讨了谷歌的基础设施如何助力企业转型,以及这对谷歌竞争力的意义。尽管谷歌可能需要转变...
Read More苹果公司开发了一款名为Ferret-UI的多模态大型语言模型(LLM),该模型具备理解移动设备用户界面的能力,有望让Siri更有效地理解并与屏幕上的元素进行互动。Ferret-UI的出现预示着Siri将能够更加直观地与iOS应用进行...
Read MoreLongcontext Alpaca训练技术最近取得了重大突破,通过在H100硬件上使用新的梯度累积卸载技术,成功训练了超过200,000个上下文窗口。这种创新方法使得大规模深度学习模型的训练变得更加高效,显著提高了计算资源的利...
Read More