漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-16 talkingdev

Facebook发布开源音频生成模型MaGNET

近日,Facebook发布了一款最先进的开源音频模型MaGNET,该模型速度是其他替代品的7倍,而且不会影响音频质量。MaGNET模型可以生成音乐和音效。MaGNET模型的论文已经发布,更多详情请访问GitHub仓库。

Read More
2024-02-15 talkingdev

Galileo AI推出设计生成工具,进一步提升设计效率

Galileo AI推出的设计生成工具,名为Galileo AI(Product),可以在极短的时间内产生高质量的界面设计。该工具使用人工智能技术,能够分析用户需求并根据需求快速生成设计。Galileo AI(Product)已经在多个设计团队中得...

Read More
2024-02-15 talkingdev

Design2Code开源:将设计转化为纯响应式的前端代码

Design2Code是一个开源项目,它可以将各种Web设计格式,包括草图、线框图、Figma和XD,转化为干净响应式的HTML/CSS/JS代码。该项目旨在简化设计师和开发人员之间的协作,提高开发效率。通过Design2Code,设计师可以...

Read More
2024-02-15 talkingdev

GenTranslate:利用LLM进一步提高翻译准确性

GenTranslate是一种新的方法,它利用大型语言模型来提高翻译质量。它专注于基础模型生成的最佳翻译。该方法在测试中已被证明优于当前领先的翻译模型。

Read More
2024-02-15 talkingdev

论文:提高AI数学技能的新方法

研究人员开发了一种新技术,通过使用基础模型自主选择高质量的数学内容来提高语言模型在数学方面的能力。这种新技术利用基础模型来选择数学内容,然后将其注入到现有的语言模型中,以提高其在数学方面的表现。这项技...

Read More
2024-02-15 talkingdev

Stable与Wurstchen发布新的文本到图像模型

Stable Cascade模型是一种新的仅用于研究的文本到图像模型,其在美学、提示忠实度和文本质量方面优于SDXL。它是使用Würstchen架构进行训练的,并具有多步架构,使调整变得容易。该模型的稳定性能够有效地提高图像生...

Read More
2024-02-15 talkingdev

亚马逊发布史上最大的文本转语音AI模型,拥有“新兴能力”

亚马逊人工智能公司发布了最新的文本转语音模型——Big Adaptive Steamable TTS with Emergent abilities(BASE TTS),该模型拥有980万个参数,并具有新兴特性,可以自然地讲述甚至是复杂的句子。该模型是当前最大的...

Read More
2024-02-14 talkingdev

苹果发布多模态LLM指导下的图像编辑代码

苹果发布了一款新的代码,使用多模态语言模型来改进人类提供的自然语言图像编辑。这个新的代码的核心思想是使用大型语言模型来指导用户对图像进行编辑,从而提高编辑的质量和效率。该代码的具体实现是将图像与自然语...

Read More
  1. Prev Page
  2. 56
  3. 57
  4. 58
  5. Next Page