漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-28 talkingdev

Llava-RLHF视觉对齐模型的全新技术突破

Llava是一种将视觉能力插入语言模型的方法。现在,它已经通过指令调整,并运行了RLHF(强化学习和直觉推理)过程。Llava大大提高了指令遵循和推理能力。这种新方法将人工智能技术推向了一个新的高度,使得计算机不仅...

Read More
2023-09-28 talkingdev

Mistral发布首个性能卓越的7B模型

在完成巨额种子轮融资并组建团队、机器学习堆栈和数据管道后,Mistral团队已经发布了一个性能极高的7B模型。该模型最初通过磁力链接(种子)以及一个最小化的GitHub Repo和宽松的许可证发布。这显示了Mistral团队在...

Read More
2023-09-27 talkingdev

【非常实用】带注解的AI研究论文合集

GitHub上有一位名叫Useful Annotated Papers的用户创建了一个代码仓库,这个仓库集合了许多来自各领域的标注论文,内容丰富而有深度。这些标注论文的内容涉及广泛,包括但不限于人工智能、机器学习、深度学习、自然...

Read More
2023-09-27 talkingdev

范畴理论与机器学习

范畴理论是对关系的抽象研究,通常被用作数学中的额外抽象层。这使得它具有强大的工具来研究机器学习。范畴理论能够提供一种全新的视角来理解和解决机器学习中的问题,通过更高层次的抽象,我们可以更深入地理解机器...

Read More
2023-09-26 talkingdev

通过被动摄像头增强深度估计的研究

这项研究提出了一种在被动摄像头中模拟主动立体感的方法,而无需使用物理图案投影仪。研究人员通过利用外部传感器的深度数据虚拟叠加图案,克服了传统设置的局限性。这种方法在各种数据集上都增强了立体算法和深度学...

Read More
2023-09-25 talkingdev

高效免费的边缘机器学习课程

本课程主要介绍如何在边缘设备上高效地进行低资源机器学习。课程包括讲座和作业。在这个课程中,我们将探讨在边缘设备上进行机器学习的技术,包括如何有效地使用有限的计算和存储资源,如何优化模型以适应边缘设备,...

Read More
2023-09-25 talkingdev

HuggingFace变形金刚中的Flash Attention 2:性能大幅提升

最新版本的Flash Attention在提升模型上下文长度和性能的同时,其速度也得到了极大的提升。目前,Flash Attention正在被HuggingFace生态系统本地化支持的过程中。Flash Attention的升级不仅仅提升了模型的运算速度,...

Read More
2023-09-22 talkingdev

论文:使用知识蒸馏制作更智能的 '迷你' 模型

这项研究探讨了如何使'学生'网络(较小的模型)在从未遇到过的情况下,更好地从'教师'网络(较大的模型)中学习。研究介绍了一种名为权重平均知识蒸馏(WAKD)的新方法,该方法的效果与现有技术一样好,但使用更为简...

Read More
  1. Prev Page
  2. 120
  3. 121
  4. 122
  5. Next Page