漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-11 talkingdev

Ada-LEval:全新基准测试,挑战理解长文本的能力

近期,Ada-LEval这一新基准测试的发布,旨在严格评估大型语言模型处理长篇及超长文本的理解能力。随着人工智能技术的不断进步,语言模型在处理文本信息方面的能力也越来越受到关注。Ada-LEval的推出,不仅为研究人员...

Read More
2024-04-11 talkingdev

策略引导扩散技术:提升离线强化学习模型性能

策略引导扩散(Policy-Guided Diffusion)是一种新颖的训练代理的方法,适用于离线环境。该技术通过创建与行为和目标策略都非常接近的综合轨迹,从而生成更加真实的训练数据。这不仅有助于提高离线强化学习模型的性...

Read More
2024-04-11 talkingdev

Rewriting PyTorch nn in Triton,开创神经网络实验库新篇章

Attorch项目旨在用Python和Triton重新编写PyTorch的nn模块部分代码,创建一个易于修改且性能卓越的神经网络实验库。这一尝试标志着以往成本过高的编写工作现在变得可行。Attorch的设计允许研究人员和开发者轻松进行...

Read More
2024-04-11 talkingdev

大型AI模型说服力研究结果惊人

最新的技术研究表明,Claude 3 Opus AI模型在说服力方面的水平与人类相差无几。该研究通过统计测试和多重比较校正来评估模型的说服力。虽然人类在说服力上略胜一筹,但这一差异在统计上并不显著,这突显了大型、复杂...

Read More
2024-04-11 talkingdev

论文:DreamView引领3D创作,文本描述转立体模型

DreamView近期推出了一项革命性的技术,能够根据文本描述生成3D对象,并支持从多个视角进行详细定制,同时确保物体整体的一致性。这一技术突破为3D设计师和开发者提供了前所未有的便利,使得从概念到实现的过程更加...

Read More
2024-04-11 talkingdev

微软携手OpenAI开发声音识别AI 助力自然灾害预警

微软与OpenAI合作研发声音识别人工智能,该技术可以通过分析环境声音来预测自然灾害。这项新近取得专利的技术通过神经网络处理声音信号,能够为地震和家庭入侵等事件提供预警。这项人工智能的集成将增强Copilot和Cha...

Read More
2024-04-11 talkingdev

谷歌Gemini Pro 1.5在Vertex AI平台上开启公开预览

谷歌在其Vertex AI平台上公开预览了最新一代生成型AI模型Gemini 1.5 Pro。该模型提供了高达100万个标记的大容量上下文窗口,这使得它能够处理更复杂的文本生成任务,同时保持高效的计算性能。此举进一步展示了谷歌在...

Read More
2024-04-11 talkingdev

Meta发布新一代AI加速芯片,专注芯片内存与吞吐量提升

Meta公司近日宣布了其人工智能加速器芯片的下一代产品。该芯片的研发重点集中在芯片内存和吞吐量上,采用了128GB的5nm内存和11 TFLOPs的int8吞吐量。这一进步意味着Meta在AI硬件领域的竞争力得到了显著增强。新一代A...

Read More
  1. Prev Page
  2. 618
  3. 619
  4. 620
  5. Next Page