漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-13 talkingdev

V3D开源-视频扩散模型增强3D生成技术

这个项目引入了一种新颖的方法,通过单个图像生成高质量、详细的3D物体,增强了3D物体的生成。该方法基于视频扩散模型,利用深度学习技术从单个视角的2D图像生成高质量的3D模型。此方法可应用于各种领域,如游戏制作...

Read More
2024-03-12 talkingdev

VideoElevator:将文本转化为视频的新方法

VideoElevator引入了一种新的方法,通过利用文本到图像模型的优势来增强文本到视频扩散模型。这种即插即用的方法将增强过程分为了调整时间运动和提升空间质量两个部分,从而产生了帧质量和文本对齐得到了提高的视频...

Read More
2024-03-12 talkingdev

Covariant推出ChatGPT,为机器人构建LLM

Covariant推出了RFM-1,旨在通过利用其Brain AI平台的大规模数据收集,为机器人语言构建大型语言模型,提高机器人在各行业的决策和交互能力。这将彻底改变机器人的行业应用,为机器人开启新的聊天界面。ChatGPT将有...

Read More
2024-03-12 talkingdev

iOS 18中AirPods Pro将获得“助听器模式”功能

据报道,苹果的AirPods Pro将在iOS 18中获得新的“助听器模式”。该设备已经提供了“对话增强”功能,但苹果没有将其广告作为助听器设备,因为这需要FDA的监管批准。目前尚不清楚苹果是否需要获得FDA的批准,以便对“助听...

Read More
2024-03-11 talkingdev

多视角图像生成技术 ViewFusion

近日,研究人员提出了一种名为 ViewFusion 的新算法,旨在改善扩散模型从新的视角生成图像的方式,确保图像在不同视角下保持一致。传统的扩散模型在处理多视角图像时,往往会产生不一致性,导致图像质量下降。ViewFu...

Read More
2024-03-08 talkingdev

微软投资法国Mistral公司,为Azure增加AI能力,但并未放弃OpenAI合作

微软近日宣布向法国人工智能公司Mistral投资1500万欧元,这表明微软的战略是增强Azure的AI能力、在欧洲市场占领先机,并在欧盟的AI行动计划出台前加强其多元化战略。Azure旨在成为一个模范园地,提供各种人工智能模...

Read More
2024-03-07 talkingdev

AI如何颠覆好莱坞

AI技术的发展,如OpenAI的Sora和其他平台正在加强视频制作,有可能简化好莱坞昂贵而复杂的电影制作过程。这些工具引发了有关创意角色的未来和行业适应AI在编写、配乐和编辑电影方面日益增强的能力的问题。好莱坞面临...

Read More
2024-03-06 talkingdev

增强图像恢复技术开源

近日,一项名为“双域条纹注意机制”的新技术在Github上发布,该技术极大地改善了图像恢复任务。传统的图像恢复方法对于纹理丰富的图像效果不佳,而这项新技术可以更好地保留图像细节和纹理信息。它通过使用双域条纹注...

Read More
  1. Prev Page
  2. 50
  3. 51
  4. 52
  5. Next Page