漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-03 talkingdev

Microsof的UniLM团队的Kosmos-2.5:将自然语言处理技术拓展至图像领域

近年来,Microsoft的UniLM团队在自然语言处理领域取得了一些显著的成果。他们最近推出的Kosmos模型套件已经进军图像领域。这次的特定实例是用于从图像读取文本密集的文件,并为该文件生成文本或标记。这与最近Meta为...

Read More
2023-09-29 talkingdev

Meta的文字转图片模型超越SDXL,引领新AI助手之路

Meta公司新推出的Emu图像生成模型已在用户偏好调查中超越SDXL。Emu模型是在11亿图像对上进行预训练的,只在几千张精心策划的图像上进行了微调。此模型将作为Meta新AI助手计划的主要支柱。Emu的高效性能,证明了大规...

Read More
2023-09-29 talkingdev

InternLM-XComposer,图文理解与创作的未来

InternLM-XComposer是一个前沿的工具,能够创建文本和图片完美配合的文章。这款工具采用了先进的图像和文本理解技术,可以根据文本内容自动生成与之相符的图片,也可以根据图片生成相应的文本。此外,该工具还支持自...

Read More
2023-09-25 talkingdev

EmoPP模型开源:实现情感感知的自然语音合成

近日,一篇研究论文介绍了一个名为EmoPP的模型,该模型融入了情感线索,以实现更准确的韵律分词预测。作者强调了韵律分词在实现自然 sounding Text-to-Speech(文本到语音)过程中的重要性。韵律分词是一种基于语音...

Read More
2023-09-22 talkingdev

自动化知识图谱:一项只需50行代码的自然语言理解神器

从非结构化文本中生成知识图谱曾被视为自然语言理解的终极目标,现在,你只需50行代码和一个LLM便可实现。知识图谱是一种复杂的数据结构,可以以图形的形式表现出各种实体之间的关系。这样的结构有助于机器更好地理...

Read More
2023-09-20 talkingdev

论文:将长篇文字转化为图像,提升文本到图像生成的新方法

将长篇文字转化为图像一直是一项艰巨的任务,尤其当需要展示的项目或细节众多时。然而,一种新的方法打破了这个困扰。这种新的方法将长篇描述分解成更简单的步骤,确保每个细节在图像中的位置都恰到好处,从而为从文...

Read More
2023-09-15 talkingdev

Coqui发布新一代文本转语音模型

科技公司Coqui近日公布了其新型文本转语音模型xtts的权重参数。该模型能够克隆语音参数,并能进行多语种的合成。此项技术的出现,无疑是对人工智能领域的一大贡献,预计将在语音合成、语音识别等多个应用领域发挥巨...

Read More
2023-09-14 talkingdev

OpenAI反驳作家们的言论,称每一个ChatGPT的回应都是衍生作品

OpenAI最近对那些声称ChatGPT是在盗版书籍上训练出来的作家们提出的诉讼给予了回应。OpenAI以转化使用为理由,寻求驳回大部分的指控,同时将这一情形与谷歌图书版权案进行比较,以此来反驳对其违反《数字千年版权法...

Read More
  1. Prev Page
  2. 18
  3. 19
  4. 20
  5. Next Page