漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-04 talkingdev

静态KV缓存实现HF推理速度2倍提升

如何加速推理是许多人关注的话题。本代码分享介绍了如何通过静态KV缓存提高Hugging Face框架上Llama模型的推理速度。

Read More
2024-03-04 talkingdev

Drive-WM让自动驾驶更安全

Drive-WM可以生成高质量的多视角视频,预测未来情景,从而使自动驾驶汽车做出更安全、更高效的驾驶决策。该技术可以根据车辆周围的环境生成准确的预测模型,为自动驾驶汽车提供更高质量的输入数据。此外,Drive-WM还...

Read More
2024-03-04 talkingdev

扩散蒸馏的悖论

扩散模型将困难问题(比如图像生成)拆分成多个小问题(比如从图像中去除微小的噪点)。单步扩散生成已经得到了很多努力,但似乎这并不符合初衷。本文探讨了扩散蒸馏的悖论,并概述了许多可供研究的方向。

Read More
2024-03-04 talkingdev

Rime发布新文本转语音模型,支持“嗯”的说话习惯

Rime推出了一款具有强大对话能力的新文本转语音模型。与以往的模型不同,这款模型可以包含“嗯”的说话习惯和逼真的停顿。

Read More
2024-03-04 talkingdev

如何将自己的模型添加到Ollama仓库

Ollama是一个开源的模型库,提供了各种各样的机器学习模型。这个库可以帮助数据科学家和机器学习工程师快速开发和部署模型。但是,有时候我们需要使用自己的模型。在本文中,我们将介绍如何将自己的模型添加到Ollama...

Read More
2024-03-04 talkingdev

Bonito开源模型,将未标注文本转换为定制训练数据集

Bonito是一种开源模型,旨在将未注释的文本转换为定制的训练数据集,从而增强大型语言模型对专业任务的适应性,而不需要预先存在的注释。

Read More
2024-03-04 talkingdev

PL2Map-轻量级神经网络实现3D建图

该项目介绍了一种新的3D建图和定位方法,使用轻量级神经网络处理点和线特征,显著提高了姿态准确性,同时占用更少的内存和计算要求。为了实现更快的姿态估计和更准确的3D建图,该方法使用了一种新的神经网络结构,该...

Read More
2024-03-04 talkingdev

探索LLMa的视频理解技术

这个仓库包含了一系列有用的资源,重点是大型语言模型在视频理解领域的应用。这些资源包括论文、代码和数据集,可以帮助研究人员和工程师更好地理解和应用LLMa模型。LLMa模型是一种基于自然语言处理的技术,在视觉和...

Read More
  1. Prev Page
  2. 300
  3. 301
  4. 302
  5. Next Page