漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-19 talkingdev

ChatGPT的浏览器Browse With Bing推出Beta版,DALL-E 3进入Beta版

ChatGPT的Browse With Bing现已退出Beta测试,DALL-E 3正在进行Beta测试。这是OpenAI最近的两个重要更新,Browse With Bing是一款由OpenAI推出的基于自然语言的浏览器,用户可以通过聊天的方式寻找信息,而DALL-E 3...

Read More
2023-10-16 talkingdev

minidalle3,提高LLMs的文本到图像生成技术

研究人员正在改进我们与文本到图像模型的交互方式,例如Midjourney和Stable Diffusion,这些模型目前需要复杂的提示才能生成图像。他们引入了“交互式文本到图像”,使人们可以自然地与大型语言模型进行交互,以获得更...

Read More
2023-10-16 talkingdev

ScaleCrafter: 高分辨率图像生成技术开源

研究人员使用预训练的扩散模型在较小的图像上进行训练,以生产大尺寸的高质量图像。他们发现在更大的图像中存在重复模式的问题,并将问题指向了模型结构的有限感知能力。

Read More
2023-10-05 talkingdev

现在可以在Bing Chat中使用OpenAI的DALL-E 3 AI图像生成

微软已将OpenAI的DALL-E 3集成到Bing Chat中,为用户提供了更强大的图像生成功能。DALL-E 3承诺提高了对提示的理解,能生成更有创意和逼真的图像。此外,微软计划将DALL-E技术应用于其他产品中,例如Windows的Paint...

Read More
2023-10-05 talkingdev

深度解析:在Jax中运行SDXL与TPU v5的协同作用

SDXL是一种最先进的图像生成模型,虽然强大,但运行速度较慢。然而,Google与HuggingFace最近在Google的研究语言Jax中展示了它在新型TPU芯片上的运行速度。通过这种新的硬件加速,SDXL的性能得到了极大的提升,可以...

Read More
2023-09-29 talkingdev

联合训练大型多模态模型:一种新的算法取得了突破

模型通常针对特定任务(例如,语言生成和图像生成)进行单独训练。然而,最近提出的一种名为联合自回归混合(JAM)的算法,通过巧妙地交叉注意力和温和的微调,成功地将不同的模型结合在一起。这种新颖的方法在多种...

Read More
2023-09-29 talkingdev

Meta的文字转图片模型超越SDXL,引领新AI助手之路

Meta公司新推出的Emu图像生成模型已在用户偏好调查中超越SDXL。Emu模型是在11亿图像对上进行预训练的,只在几千张精心策划的图像上进行了微调。此模型将作为Meta新AI助手计划的主要支柱。Emu的高效性能,证明了大规...

Read More
2023-09-28 talkingdev

UnitedHuman:高质量人像图像生成方式开源

本项目推出了一款名为UnitedHuman的新工具,它能够使用来自多个不同来源的图像,并将它们进行组合,即使这些图像的大小不同或者关注的焦点不同。UnitedHuman的强大之处在于,它能够克服这些差异,生成出高质量的人像...

Read More
2023-09-28 talkingdev

Meta Connect 2023:Quest 3 VR、Ray-Ban智能眼镜和Meta AI的一切

Meta的年度Connect大会已经开始,这意味着有很多新的硬件发布。本文总结了主题演讲中最重要的公告。这些公告涉及Meta Quest 3、Quest上的Xbox Cloud游戏、一种名为Emu的图像生成新基础模型、Ray-Ban Meta智能眼镜和M...

Read More
2023-09-27 talkingdev

Getty联手Nvidia推出商业化图像生成服务

由Nvidia赋能的Getty最近推出了一项商业图像生成服务,该服务提供了强大的商业保障。这一服务的推出,将进一步推动图像生成技术的商业应用,特别是在广告、媒体和娱乐等行业,提供更加贴近需求的图像内容。Getty与Nv...

Read More
  1. Prev Page
  2. 9
  3. 10
  4. 11
  5. Next Page