漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-25 talkingdev

单张图像快速重建3D模型技术突破:高斯飞溅技术推动3D重建前进

近日,一项关于单张图像快速重建3D模型的新技术取得了突破。该技术基于高斯飞溅技术,通过学习性技术将图像中的每个像素映射到一个3D高斯函数中,从而实现单张图像的3D重建。这一技术的创新点在于引入了“飞溅图像”,...

Read More
2023-12-07 talkingdev

谷歌通过SDXL技术实现图文风格一致性

谷歌最近基于SDXL技术推出了一项令人惊叹的工作,该工作通过多代人的注意力共享来维护一致的样式。这种方法至关重要的是不需要进行任何微调。

Read More
2023-11-29 talkingdev

360度全景成像混合技术实现开源

研究人员已经设计出一种独特的圆形混合方法来解决创建无缝360度全景图像的长期难题。这种技术是他们从文本和单张图像生成全景图像的创新模型的关键特征。

Read More
2023-10-26 talkingdev

Humane推出AI助手胸针,搭载GPT-4技术

Humane公司推出了一款AI助手胸针,可通过磁性吸附于衣物上,搭载了GPT-4技术。与其他AI助手不同,Humane的AI助手胸针注重保护用户隐私,不会记录、共享或出售用户的数据。通过GPT-4技术,Humane的AI助手胸针可以实现...

Read More
2023-10-25 talkingdev

噪声调度改进了视频扩散技术

单个提示生成单个图像通常很好,但在生成视频时由于帧之间的时间变化而失败。 然而,更改文本时的一致性非常具有挑战性。 这项工作解决了这两个问题,并利用扩散技术实现了长达512帧的生成。

Read More
2023-10-05 talkingdev

Claude推出新技术提升技术文档索引能力

Claude最近推出了一项新技术,该技术将其记忆库的容量提高到了100,000个令牌。此次技术升级主要通过两种技术实现了对技术文档的索引能力的提升。Anthropic公司也对此进行了全面的发布,并推出了名为'Anthropic Cookb...

Read More
2023-09-25 talkingdev

Haystack:开源LLM框架助力打造高效应用程序

Haystack,一款在GitHub上拥有10,785颗星的开源项目,提供了快速设计和构建可扩展、API驱动的LLM后端所需的一切工具。此开源框架的主要功能是可以帮助开发人员快速构建出高效且可靠的应用程序。通过使用Haystack,开...

Read More
2023-09-14 talkingdev

instaflow-利用流校正技术实现文本到图像生成的超速进程

研究人员已经找到一种方法,通过使用名为校正流(Rectified Flow)的技术,加快将文本转化为图像的过程。校正流技术是一种新颖的方法,它可以加速和优化图像的生成过程。这种方法凭借其高效的性能,为文本到图像的快...

Read More
  1. Prev Page
  2. 9
  3. 10
  4. 11
  5. Next Page