漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-28 talkingdev

Mistral指令模型:无专有数据,却超越众多顶级模型

近日,Mistral指令模型在HuggingFace Hub上受到了业界的广泛关注。其口号“无秘诀,无专有数据”引人注目。Mistral模型无需依赖任何秘诀或专有数据,仅凭其出色的算法设计和模型结构,就可以超越许多顶级的指令模型,...

Read More
2023-09-28 talkingdev

QA-LoRA的智能构建和微调方法,让LLM更快更小

大型语言模型在许多设备上的运行效率受限于其庞大的计算需求。然而,一个名为QA-LoRA的新方法已经成功改变了这一局面。QA-LoRA通过巧妙地改变模型的构建和微调方式,使得大型语言模型能够在维持强大功能的同时,有效...

Read More
2023-09-28 talkingdev

论文:RankVicuna,使用语言模型重新排序搜索结果

大型模型如ChatGPT已被用于提升搜索结果的效果,但由于这些测试往往是隐蔽或秘密进行的,所以很难进行重复。研究人员推出了RankVicuna,这是一个开源工具,能够使用语言模型重新排序搜索结果。这款工具的出现为我们...

Read More
2023-09-28 talkingdev

Llava-RLHF视觉对齐模型的全新技术突破

Llava是一种将视觉能力插入语言模型的方法。现在,它已经通过指令调整,并运行了RLHF(强化学习和直觉推理)过程。Llava大大提高了指令遵循和推理能力。这种新方法将人工智能技术推向了一个新的高度,使得计算机不仅...

Read More
2023-09-28 talkingdev

RL在扩散模型上的应用库

利用RL调整语言模型正逐渐成为模型部署流程中的标准步骤。现在,这将通过扩散模型以及DRLX的发布变得更加容易,DRLX允许用户指定奖励模型或使用预定义的模型。扩散模型通过简化了RL在语言模型调整中的实现,为AI技术...

Read More
2023-09-28 talkingdev

Mistral发布首个性能卓越的7B模型

在完成巨额种子轮融资并组建团队、机器学习堆栈和数据管道后,Mistral团队已经发布了一个性能极高的7B模型。该模型最初通过磁力链接(种子)以及一个最小化的GitHub Repo和宽松的许可证发布。这显示了Mistral团队在...

Read More
2023-09-28 talkingdev

Meta Connect 2023:Quest 3 VR、Ray-Ban智能眼镜和Meta AI的一切

Meta的年度Connect大会已经开始,这意味着有很多新的硬件发布。本文总结了主题演讲中最重要的公告。这些公告涉及Meta Quest 3、Quest上的Xbox Cloud游戏、一种名为Emu的图像生成新基础模型、Ray-Ban Meta智能眼镜和M...

Read More
2023-09-27 talkingdev

OpenAI的GPT-4虽然在视觉领域有所突破,但仍存在缺陷

尽管OpenAI在防止其GPT-4视觉模型破解CAPTCHAS以及基于年龄和种族估计人的年龄方面已经取得了一定的进步,但它仍然有时难以进行推理,并且仍然容易产生幻觉。这些问题暴露出,尽管我们在人工智能的发展和应用上取得...

Read More
  1. Prev Page
  2. 359
  3. 360
  4. 361
  5. Next Page