漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-29 talkingdev

Meta的文字转图片模型超越SDXL,引领新AI助手之路

Meta公司新推出的Emu图像生成模型已在用户偏好调查中超越SDXL。Emu模型是在11亿图像对上进行预训练的,只在几千张精心策划的图像上进行了微调。此模型将作为Meta新AI助手计划的主要支柱。Emu的高效性能,证明了大规...

Read More
2023-09-29 talkingdev

InternLM-XComposer,图文理解与创作的未来

InternLM-XComposer是一个前沿的工具,能够创建文本和图片完美配合的文章。这款工具采用了先进的图像和文本理解技术,可以根据文本内容自动生成与之相符的图片,也可以根据图片生成相应的文本。此外,该工具还支持自...

Read More
2023-09-25 talkingdev

EmoPP模型开源:实现情感感知的自然语音合成

近日,一篇研究论文介绍了一个名为EmoPP的模型,该模型融入了情感线索,以实现更准确的韵律分词预测。作者强调了韵律分词在实现自然 sounding Text-to-Speech(文本到语音)过程中的重要性。韵律分词是一种基于语音...

Read More
2023-09-22 talkingdev

自动化知识图谱:一项只需50行代码的自然语言理解神器

从非结构化文本中生成知识图谱曾被视为自然语言理解的终极目标,现在,你只需50行代码和一个LLM便可实现。知识图谱是一种复杂的数据结构,可以以图形的形式表现出各种实体之间的关系。这样的结构有助于机器更好地理...

Read More
2023-09-20 talkingdev

论文:将长篇文字转化为图像,提升文本到图像生成的新方法

将长篇文字转化为图像一直是一项艰巨的任务,尤其当需要展示的项目或细节众多时。然而,一种新的方法打破了这个困扰。这种新的方法将长篇描述分解成更简单的步骤,确保每个细节在图像中的位置都恰到好处,从而为从文...

Read More
2023-09-15 talkingdev

Coqui发布新一代文本转语音模型

科技公司Coqui近日公布了其新型文本转语音模型xtts的权重参数。该模型能够克隆语音参数,并能进行多语种的合成。此项技术的出现,无疑是对人工智能领域的一大贡献,预计将在语音合成、语音识别等多个应用领域发挥巨...

Read More
2023-09-14 talkingdev

OpenAI反驳作家们的言论,称每一个ChatGPT的回应都是衍生作品

OpenAI最近对那些声称ChatGPT是在盗版书籍上训练出来的作家们提出的诉讼给予了回应。OpenAI以转化使用为理由,寻求驳回大部分的指控,同时将这一情形与谷歌图书版权案进行比较,以此来反驳对其违反《数字千年版权法...

Read More
2023-09-14 talkingdev

instaflow-利用流校正技术实现文本到图像生成的超速进程

研究人员已经找到一种方法,通过使用名为校正流(Rectified Flow)的技术,加快将文本转化为图像的过程。校正流技术是一种新颖的方法,它可以加速和优化图像的生成过程。这种方法凭借其高效的性能,为文本到图像的快...

Read More
  1. Prev Page
  2. 24
  3. 25
  4. 26
  5. Next Page