漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-06 talkingdev

Meta揭秘大脑波形中的语言密码

Meta科学家最近开发出了一种全新的方法,通过研究大脑波形,理解人们思考或听到的词语和短语,而无需进行任何手术。这一技术或许将为我们提供新的视角,去理解大脑如何处理和解码语言信息。通过这种方法,我们将有可...

Read More
2023-10-05 talkingdev

MiniGPT-5:一种全新的图文生成方式

试想一下,如果有一个模型既能理解和撰写文本,同时也能创作出匹配的图片,那将是多么的神奇。这就是新模型MiniGPT-5所能做到的。MiniGPT-5采用了一种被称为“生成vokens”的特殊技术来实现这一目标。所谓的“生成voken...

Read More
2023-10-03 talkingdev

Microsof的UniLM团队的Kosmos-2.5:将自然语言处理技术拓展至图像领域

近年来,Microsoft的UniLM团队在自然语言处理领域取得了一些显著的成果。他们最近推出的Kosmos模型套件已经进军图像领域。这次的特定实例是用于从图像读取文本密集的文件,并为该文件生成文本或标记。这与最近Meta为...

Read More
2023-09-29 talkingdev

Meta的文字转图片模型超越SDXL,引领新AI助手之路

Meta公司新推出的Emu图像生成模型已在用户偏好调查中超越SDXL。Emu模型是在11亿图像对上进行预训练的,只在几千张精心策划的图像上进行了微调。此模型将作为Meta新AI助手计划的主要支柱。Emu的高效性能,证明了大规...

Read More
2023-09-29 talkingdev

InternLM-XComposer,图文理解与创作的未来

InternLM-XComposer是一个前沿的工具,能够创建文本和图片完美配合的文章。这款工具采用了先进的图像和文本理解技术,可以根据文本内容自动生成与之相符的图片,也可以根据图片生成相应的文本。此外,该工具还支持自...

Read More
2023-09-25 talkingdev

EmoPP模型开源:实现情感感知的自然语音合成

近日,一篇研究论文介绍了一个名为EmoPP的模型,该模型融入了情感线索,以实现更准确的韵律分词预测。作者强调了韵律分词在实现自然 sounding Text-to-Speech(文本到语音)过程中的重要性。韵律分词是一种基于语音...

Read More
2023-09-22 talkingdev

自动化知识图谱:一项只需50行代码的自然语言理解神器

从非结构化文本中生成知识图谱曾被视为自然语言理解的终极目标,现在,你只需50行代码和一个LLM便可实现。知识图谱是一种复杂的数据结构,可以以图形的形式表现出各种实体之间的关系。这样的结构有助于机器更好地理...

Read More
2023-09-20 talkingdev

论文:将长篇文字转化为图像,提升文本到图像生成的新方法

将长篇文字转化为图像一直是一项艰巨的任务,尤其当需要展示的项目或细节众多时。然而,一种新的方法打破了这个困扰。这种新的方法将长篇描述分解成更简单的步骤,确保每个细节在图像中的位置都恰到好处,从而为从文...

Read More
  1. Prev Page
  2. 16
  3. 17
  4. 18
  5. Next Page