漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-07-17 talkingdev

个性化文本到图像模型:让你的创作动起来

这份报告介绍了一个新系统,它可以为您使用Stable Diffusion、DreamBooth、LoRA等个性化文本到图像模型创建的任何图像添加逼真的运动。该系统使用一个“运动模块”,从现实生活的视频中学习,并可添加到任何文本到图像...

Read More
2023-07-13 talkingdev

AI工具CAT-ViL:实现手术视频的可视化解答

本文介绍了一种深度学习工具——CAT-ViL,该工具能够对手术视频进行详细的解答并进行可视化。这是一项实质性的创新,将极大地帮助医学生和初级外科医生的学习和实践。通过CAT-ViL工具,用户可以通过查询特定的手术步骤...

Read More
2023-07-04 talkingdev

文本生成无缝视频方案开源

本论文提出了一种新的方法,用于从文本生成一致且高质量的视频。它通过使用经过调整的图像模型创建关键帧,然后利用特殊的匹配和混合技术将这些样式传播到整个视频中,从而产生外观出色且流畅的视频

Read More
2023-07-03 talkingdev

Humane首款设备命名为“Humane Ai Pin”,将于今年发布

Humane是由前苹果员工创立的一家公司,旨在打造一个以人工智能为先的后智能手机时代。该公司宣布其首款设备将被命名为Humane Ai Pin。目前关于这款设备的工作原理、功能和外观等信息还不多。Humane与高通合作,将使...

Read More
2023-06-29 talkingdev

FunQA:专注于惊喜内容的视频问答数据集

FunQA是一个创新的数据集,旨在测试和提升模型对令人惊喜的视频的理解能力,例如幽默或创意视频片段,推动模型在时间戳定位、视频描述和推理等领域的能力。

Read More
2023-06-26 talkingdev

embedchain:一个用于创建基于大型语言模型的聊天机器人的框架

embedchain是一个用于创建基于大型语言模型的聊天机器人的框架。它抽象了加载数据集、分块、创建嵌入和存储到向量数据库的整个过程。用户可以通过链接到媒体文件,如视频、PDF、博客文章或网站,创建聊天机器人。这...

Read More
2023-06-21 talkingdev

Novel:一款带有AI智能补全功能的Notion风格编辑器

Novel是一款带有AI智能补全功能的Notion风格编辑器。它可以一键部署到Vercel上。还有一个30秒的视频演示可供查看。

Read More
2023-06-17 talkingdev

Gyroflow:一款开源的先进陀螺仪视频稳定工具

Gyroflow是一款开源的先进陀螺仪视频稳定工具,利用陀螺仪数据来稳定视频。它的特点如下: - 开放源代码,可自由使用和修改; - 基于陀螺仪数据,能够在各种设备上提供高质量的视频稳定效果; - 集成了多种滤波算法...

Read More
2023-06-15 talkingdev

Synthesia完成9000万美元C轮融资,加速AI研究和升级视频编辑平台

Synthesia近日宣布完成9000万美元C轮融资,由Accel领投。这笔融资将有助于Synthesia实现让每个人都能轻松创建视频的使命,推动其AI研究,升级其协作视频编辑平台,提供更好的头像技术、实时协作和增强的分享功能。...

Read More
2023-06-14 talkingdev

一键制作深度伪造视频,Roop (GitHub Repo)火了!

近日,GitHub上一个名为Roop的仓库备受关注,该仓库提供了一键制作深度伪造视频的功能,引起了广泛关注。 该仓库的特点如下: - 一键制作:只需要上传一张照片,Roop就可以自动将照片中的人脸替换成视频中的演员或...

Read More
  1. Prev Page
  2. 29
  3. 30
  4. 31
  5. Next Page