漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-13 talkingdev

Meta发布可控制风格的音频AI基础模型

Meta最近发布了一篇关于音频AI基础模型的论文,并发布了更多的样本和引人入胜的演示。该项目的主要目标是生成可控制风格的音频内容,所有风格都来自同一个模型。

Read More
2023-11-23 talkingdev

精准前瞻解码可减少推理延迟2.3倍

加速自回归语言模型推理的方式有很多。人们正在热衷于使用草稿模型的一种方式。这需要两个模型,但速度可能会更慢。然而,通过从相同模型生成相关的n-gram,可以减轻对草稿模型的需求,并使生成速度线性加快。

Read More
2023-11-20 talkingdev

Meta公布视频编辑和创作模型

往往情况下,当你使用生成模型生成一张图片后,它不完全是你想要的。然而,使用同一模型对图像进行编辑是极具挑战性的。Meta有一个关键的想法,即将所有生成视为指令,从而使编辑功能出现。这与新的模型架构的简单性...

Read More
2023-11-16 talkingdev

LLM可使用隐写术隐藏推理过程

红木研究的一项研究表明,大型语言模型(LLMs)可以掌握“编码推理”,这是一种隐写术,允许LLMs在生成的文本中嵌入中间推理步骤,使它们对人类来说不可解。这种技术可以让模型在不暴露其推理方法的情况下生成高质量的文...

Read More
2023-11-08 talkingdev

OpenAI开源其稳定扩散一致性解码器

OpenAI最近发布了用于稳定扩散的一致性解码器,这将极大地改善潜在扩散模型生成图像的性能。这是一个开源项目,可在GitHub上获得。随着这种技术的进步,我们可以期待AI在图像生成方面的更多突破。

Read More
2023-11-03 talkingdev

用于RAG、微调和模型服务的开源工具包

最近,一家开发团队发布了一个名为“LLM Toolkit”的开源Python工具包,用于构建基于RAG的语言模型生成应用程序。它提供了快速的RAG微调、模型训练和服务脚本,同时支持多种文本数据输入和输出格式。该工具包的代码已...

Read More
2023-10-20 talkingdev

探究LLMs如何表达真相

近年来,大型语言模型(LLMs)在自然语言处理领域引起了广泛关注,但它们如何表达真相仍然是一个有待研究的问题。为了解决这个问题,研究人员开发了一些交互式图表,可以帮助用户更好地理解LLMs如何表示真相。这些图表...

Read More
2023-09-25 talkingdev

打造超真实虚拟人形:新模型生成各种姿态与身形

本篇论文提出了一种能够创造出超级真实的虚拟人类模型,无论你想到的任何姿势,这种模型都能完美呈现。这是首款仅通过虚拟数据训练出来的模型,但其所生成的人类形态却具有极高的准确度,这对科学研究和电子游戏领域...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page