漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-15 talkingdev

Swarovski开发AI智能双筒望远镜,能识别9000种鸟类和野生动物

Swarovski推出了一款AI智能双筒望远镜,能够识别9000多种鸟类和野生动物,同时还能拍摄照片和视频。这个智能双筒望远镜内置了AI算法,可以对拍摄的图像进行分析和识别,从而快速准确地识别出目标物体。这款智能双筒...

Read More
2024-01-12 talkingdev

eTH:可扩展的电动房车变身离网豪华迷你住宅

eTH(Electric Transformer House)是一款可扩展的豪华迷你住宅,拥有400平方英尺的居住空间、太阳能电池板等多项功能。该房车拥有豪华的内饰、智能科技以及清洁能源供离网能力使用。它配备了美食厨房、宽敞的客厅和...

Read More
2024-01-11 talkingdev

Rabbit推出大型行动模型和电脑(在线视频

Rabbit推出了一款大型行动模型(LAM),可与其R1口袋伴侣电脑搭配使用。该公司的R1设备是计算机和智能手机的重新构想,几乎完全由其LAM驱动。

Read More
2024-01-10 talkingdev

论文:研究人员开发出4D人脸视频编辑技术

研究人员开发出一种人脸视频编辑架构,该架构结合了GAN-NeRF技术用于3D一致性和一种新的稳定器用于平滑的时间相干性。这种方法在编辑视频方面表现出色,通过保持一致的视角和帧之间的无缝转换来实现。

Read More
2024-01-10 talkingdev

Rabbit R1:AI 助手智能独立设备

Rabbit R1 是一款售价为199美元的独立设备,只有 iPhone 大小一半,由 'Large Action Model' 驱动。它有一个 2.88 英寸的触摸屏、一个用于拍照和录像的旋转摄像头、一个用于导航的滚轮/按钮、128GB 的存储空间和一整...

Read More
2024-01-08 talkingdev

ODTrack开源,改进视频追踪系统

ODTrack是一个新的视频追踪系统,改进了我们在视频中跟踪物体的方式。与老旧系统在连接过去和未来的视频帧时存在困难不同,ODTrack使用一种称为'在线令牌传播'的方法来更好地连接连续的视频帧。通过这种方法,ODTrac...

Read More
2024-01-02 talkingdev

谷歌发布VideoPoet论文:合成高质量音视频

VideoPoet是一种语言模型,能够从各种各样的条件信号中合成高质量的视频和相应的音频。

Read More
2023-12-21 talkingdev

论文:利用卷积神经网络进行深度伪造检测

本研究提出了一种深度学习方法,利用四个预训练的卷积神经网络模型来识别视频中的深度伪造人脸,可实现高精度检测。深度伪造技术已成为一种严重的威胁,对政治、社会和经济稳定造成了巨大的影响。该研究提出的方法可...

Read More
2023-12-21 talkingdev

VideoPoet:谷歌语言模型在视频创作中大放异彩

Google的VideoPoet是一种开创性的语言模型,它在处理文本到视频视频风格化甚至视频到音频转换等多种任务方面具有独特的能力。这种方法通过将多种视频生成技术融合到一个模型中而脱颖而出。VideoPoet的革命性技术为...

Read More
2023-12-20 talkingdev

基于UNet编码器实现更快的扩散模型

最近的一项研究表明,与解码器相比,使用UNet编码器在扩散模型中表现更加稳定。这一发现导致了一种新的编码器传播方案,显著加快了文本到图像和文本到视频生成等任务的速度。该研究成果已在GitHub上发布。

Read More
  1. Prev Page
  2. 24
  3. 25
  4. 26
  5. Next Page