漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-21 talkingdev

探秘OpenAI企业内部文化(播客)

你是否曾经想知道OpenAI是如何以如此快的速度进行创新和建设的?在这个播客中,OpenAI的开发关系负责人Logan Kilpatrick讨论了OpenAI的独特文化、高度代理和紧迫性的重要性以及公司推出产品的决策框架。

Read More
2024-01-31 talkingdev

论文:AI模型手部图像生成能力得到优化

研究人员通过在训练手部注释图像中添加三个额外通道,改善了生成模型(例如GAN和扩散模型)创建逼真手部图像的能力。这种方法利用了手部形态的先验知识,可以应用于许多手部相关的任务,例如手语翻译和手势识别。此...

Read More
2024-01-24 talkingdev

MM-Interleaved模型开源,可实现图文数据生成

近日,GitHub开源了MM-Interleaved模型,该模型在处理和生成交替的图文数据方面表现出色。MM-Interleaved模型能够根据输入的文本描述生成对应的图像,同时也可以从图像中提取文本。该模型使用了条件生成对抗网络(Co...

Read More
2024-01-15 talkingdev

论文:深入探究盲目运动去模糊技术

本文全面介绍深度学习在计算机视觉中的关键领域--盲目运动去模糊技术的作用。从传统方法的基本概念和局限性到现代技术如CNN、GAN、RNN和Transformer的详细比较,本文进行了全面的梳理。本文还对计算机视觉领域的未来...

Read More
2024-01-11 talkingdev

人体姿态与身形编辑技术取得新突破

该项目介绍了一种一次性编辑人类图像的方法,可以在保留人的身份的同时,对姿势和身形进行重大变化。该技术基于深度学习模型,利用对抗生成网络 (GAN) 和条件生成网络 (CGAN) 的方法,用户只需提供一张人体图像,就...

Read More
2024-01-10 talkingdev

论文:研究人员开发出4D人脸视频编辑技术

研究人员开发出一种人脸视频编辑架构,该架构结合了GAN-NeRF技术用于3D一致性和一种新的稳定器用于平滑的时间相干性。这种方法在编辑视频方面表现出色,通过保持一致的视角和帧之间的无缝转换来实现。

Read More
2024-01-08 talkingdev

谷歌DeepMind AlphaFold AI技术获得Eli Lilly、Novartis 两项将近30亿美元的新交易

Alphabet的等距堆叠在最新一笔交易中将增强谷歌DeepMind的AlphaFold AI技术,该技术预测蛋白质结构,以实现更快的靶点发现和化合物构建。这些交易涉及发现用于尚未公开的靶标的小分子疗法。这些公告是J.P. Morgan He...

Read More
2023-12-11 talkingdev

Kandinsky3.0:升级版文本转图像技术,实现更高质量、真实感的图像生成

Kandinsky 3.0是一种文本转图像模型,它可以从文本中生成更加真实的图像。Kandinsky 3.0采用了最新的生成对抗网络(GAN)模型,通过学习图像语义和语法,从而生成更加逼真、高质量的图像。该技术的应用将会在电影、...

Read More
2023-12-08 talkingdev

Meta推出AI图像生成器Imagine,可作为独立网站使用

Meta发布了一个名为Imagine的独立图像生成器,其拥有自己的网站,使用生成式人工智能从文本提示中创建图像。该工具使用GAN(生成式对抗网络)技术,可以生成高度逼真的图像,用户只需输入文本提示,就可以生成与之相...

Read More
2023-12-05 talkingdev

StyleGAN-嵌入式个性化图像生成技术

一种新的方法利用扩展的StyleGAN嵌入空间W+用于文本到图像扩散模型,提高了生成图像中的身份保留能力。这种技术可以为个性化的图像生成提供更多的可能性,更好地满足用户的需求。

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3
  5. Next Page