漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-04 talkingdev

Rime发布新文本转语音模型,支持“嗯”的说话习惯

Rime推出了一款具有强大对话能力的新文本转语音模型。与以往的模型不同,这款模型可以包含“嗯”的说话习惯和逼真的停顿。

Read More
2024-03-04 talkingdev

如何将自己的模型添加到Ollama仓库

Ollama是一个开源的模型库,提供了各种各样的机器学习模型。这个库可以帮助数据科学家和机器学习工程师快速开发和部署模型。但是,有时候我们需要使用自己的模型。在本文中,我们将介绍如何将自己的模型添加到Ollama...

Read More
2024-03-04 talkingdev

Bonito开源模型,将未标注文本转换为定制训练数据集

Bonito是一种开源模型,旨在将未注释的文本转换为定制的训练数据集,从而增强大型语言模型对专业任务的适应性,而不需要预先存在的注释。

Read More
2024-03-04 talkingdev

PL2Map-轻量级神经网络实现3D建图

该项目介绍了一种新的3D建图和定位方法,使用轻量级神经网络处理点和线特征,显著提高了姿态准确性,同时占用更少的内存和计算要求。为了实现更快的姿态估计和更准确的3D建图,该方法使用了一种新的神经网络结构,该...

Read More
2024-03-04 talkingdev

探索LLMa的视频理解技术

这个仓库包含了一系列有用的资源,重点是大型语言模型在视频理解领域的应用。这些资源包括论文、代码和数据集,可以帮助研究人员和工程师更好地理解和应用LLMa模型。LLMa模型是一种基于自然语言处理的技术,在视觉和...

Read More
2024-03-04 talkingdev

论文:深度语义理解,从粗到细的潜在扩散图像合成方法

粗到细潜在扩散(CFLD)方法引入了一种新的姿势引导人像合成方法,通过对图像进行深度语义理解来避免过拟合,克服了现有模型的局限性。

Read More
2024-03-04 talkingdev

关于LLM量化的全面研究

随着人工智能模型的不断发展,越来越多的研究人员开始研究如何在不影响模型准确性的前提下,提高模型的计算效率和内存利用率。LLM量化是一种后训练量化技术,可以使像OPT和LLaMA2这样的大型语言模型更具内存和计算效...

Read More
2024-03-04 talkingdev

Genie世界模型:可生成交互式环境

Google DeepMind的Genie是一个基础的世界模型,通过在互联网视频上进行训练,可以从合成图像、照片甚至草图中生成各种可玩(动作可控)的环境。该模型使用了深度强化学习和生成式建模技术,可以为游戏开发、虚拟现实...

Read More
  1. Prev Page
  2. 269
  3. 270
  4. 271
  5. Next Page