漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-28 talkingdev

文本和姿势条件助力AID与PAID技术提升图像生成质量

AID及其变体PAID是两种旨在通过加入文本和姿势等条件来改进图像插值的技术。这些方法确保生成的图像在不需要额外训练的情况下,具有更高的一致性、平滑度和真实性。图像生成技术的进步不仅推动了人工智能领域的创新...

Read More
2024-03-26 talkingdev

论文:图像合成中的写实阴影生成技术取得新突破

最近的一项研究提出了一种新的图像合成中写实阴影生成的方法,解决了以往在形状和强度准确性方面的挑战。研究人员通过增强ControlNet的强度调节模块以及扩展DESOBA数据集,显著提高了图像中阴影生成的质量。该技术的...

Read More
2024-03-22 talkingdev

Cohere推出面向企业级应用的Command-R模型,即将登陆NVIDIA API目录

Cohere近日推出了专为大规模生产而优化的RAG(Retrieval-Augmented Generation)模型Command-R,并宣布将该模型引入NVIDIA新推出的API目录。Command-R模型结合了检索与生成技术,能够助力企业快速进入大规模生产环境...

Read More
2024-03-20 talkingdev

深度解析:SORA技术内幕

本文由前OpenAI科学家撰写,深入探讨了SORA技术及其生成视频的潜在成本。SORA是一种先进的视频生成技术,通过复杂的算法和大量的数据处理,能够创建出高质量的视频内容。文章详细介绍了SORA的工作原理,包括其如何处...

Read More
2024-03-15 talkingdev

Assort Health获得350万美元融资,将扩大面向医疗呼叫中心的第一代AI生成技术

Assort Health宣布获得350万美元的融资,以扩大其专门为医疗呼叫中心设计的生成式人工智能解决方案。该解决方案将利用AI生成呼叫中心代理人所需的所有内容。Assort Health表示,这将有助于医疗呼叫中心提高效率和质...

Read More
2024-03-14 talkingdev

论文:SSMs-线性内存消耗与高质量的视频生成

这项研究介绍了一种创新的视频生成方法,使用状态空间模型(SSMs)克服了传统的基于注意力扩散模型的内存限制,重点关注线性内存消耗。在UCF101和MineRL Navigate数据集的测试中,SSMs能够创建具有竞争力质量的更长...

Read More
2024-03-13 talkingdev

V3D开源-视频扩散模型增强3D生成技术

这个项目引入了一种新颖的方法,通过单个图像生成高质量、详细的3D物体,增强了3D物体的生成。该方法基于视频扩散模型,利用深度学习技术从单个视角的2D图像生成高质量的3D模型。此方法可应用于各种领域,如游戏制作...

Read More
2024-03-12 talkingdev

F2D-个性化可编辑的人脸生成技术

Face2Diffusion(F2D)为创建个性化人脸提供了一种新的解决方案,通过滤除非必要的身份信息,解决了过度拟合的常见问题,从而提高了可编辑性。F2D使用扩散卷积算法来生成人脸,该算法可以生成高质量的人脸图像,并且...

Read More
  1. Prev Page
  2. 7
  3. 8
  4. 9
  5. Next Page