漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-22 talkingdev

FontDiffuser:开源一键式字体生成技术

阿里巴巴推出了一项名为FontDiffuser的技术,该技术是一种基于扩散的自动字体生成方法,特别擅长处理复杂字符和大规模风格变化。它采用多尺度内容聚合块来更好地保留笔画,并配备了风格对比细化模块来进行风格转移。...

Read More
2023-12-21 talkingdev

VideoPoet:谷歌语言模型在视频创作中大放异彩

Google的VideoPoet是一种开创性的语言模型,它在处理文本到视频,视频风格化甚至视频到音频转换等多种任务方面具有独特的能力。这种方法通过将多种视频生成技术融合到一个模型中而脱颖而出。VideoPoet的革命性技术为...

Read More
2023-12-08 talkingdev

Meta推出AI图像生成器Imagine,可作为独立网站使用

Meta发布了一个名为Imagine的独立图像生成器,其拥有自己的网站,使用生成式人工智能从文本提示中创建图像。该工具使用GAN(生成式对抗网络)技术,可以生成高度逼真的图像,用户只需输入文本提示,就可以生成与之相...

Read More
2023-12-05 talkingdev

StyleGAN-嵌入式个性化图像生成技术

一种新的方法利用扩展的StyleGAN嵌入空间W+用于文本到图像扩散模型,提高了生成图像中的身份保留能力。这种技术可以为个性化的图像生成提供更多的可能性,更好地满足用户的需求。

Read More
2023-11-28 talkingdev

KskyVideo-文本到视频生成技术开源

Kandinsky Video采用双阶段文本到视频生成技术。首先,它通过关键帧来勾勒视频的故事情节,然后平滑过渡和移动,大大提高了视频质量并降低了计算要求。

Read More
2023-11-14 talkingdev

Jupyter Notebook实现超快速语音生成技术

Bark是一种文本转语音系统,它可以生成连贯、快速和超长的音频输出。现在,我们可以在Jupyter Notebook中使用Bark,将文本转换为语音文件,使其更加便捷。Bark使用深度神经网络作为其文本到语音模型,具有很高的准确...

Read More
2023-11-08 talkingdev

Xbox携手Inworld AI开发AI工具以推动游戏开发创新

微软的Xbox与Inworld AI合作,提供AI驱动的游戏开发工具,聚焦于叙事和角色创造,以促进和丰富游戏设计流程。Inworld AI的自然语言生成技术将被应用于游戏开发中,以帮助设计师更快地构建角色和编写对话。这种技术将...

Read More
2023-10-20 talkingdev

ProductAI推出AI生成产品照片技术

ProductAI是一家提供人工智能(AI)解决方案的公司,日前推出了一项新技术,可通过AI生成高质量的产品照片。这项技术基于计算机视觉和机器学习,能够快速、准确地生成符合规格的产品照片。根据公司表示,这项技术不...

Read More
  1. Prev Page
  2. 9
  3. 10
  4. 11
  5. Next Page