漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-30 talkingdev

Stori AI:让你的创意变成引人注目的品牌推文

Stori AI是一家专注于提供社交媒体视觉内容服务的公司。近日,Stori AI推出了全新的产品,该产品可以将用户的创意转化为视觉上具有吸引力的品牌社交帖文。这个产品利用了人工智能和机器学习技术,可以自动为用户生成...

Read More
2024-01-30 talkingdev

论文:医学视频分割技术实现突破

医学视频中的目标分割一直是医学影像处理的难点之一。近日,研究人员提出了一种名为 Vivim 的新型医学视频目标分割框架,该框架通过采用状态空间模型的方法对时空数据进行高效压缩,从而在更短的时间内实现更加准确...

Read More
2024-01-22 talkingdev

WhisperSpeech: 倒置Whisper技术实现的文本转语音系统

WhisperSpeech是一种倒置Whisper技术实现的文本转语音系统。该系统目前仅在英语LibreLight数据集上进行了训练,但未来的版本将面向多种语言。在该仓库中提供了合成语音的示例。

Read More
2024-01-17 talkingdev

Meta新技术,实现语音克隆和翻译无缝衔接

Meta最近展示了一项新的技术,可以实现语音克隆和翻译的无缝衔接。该技术使用深度学习和自然语言处理等技术,可以在不改变说话者声音和语调的情况下,将一种语言翻译成另一种语言。这种技术将为多语种交流和语言学习...

Read More
2024-01-12 talkingdev

Potis AI:利用AI技术实现自动化面试

近日,Potis AI在一场新品发布会上推出了一款基于人工智能技术的自动行为面试产品。该产品通过AI算法分析应聘者的语音、面部表情、姿态等信息,快速评估其职业素养、人际交往能力、团队协作能力等关键能力,大大提高...

Read More
2023-12-25 talkingdev

单张图像快速重建3D模型技术突破:高斯飞溅技术推动3D重建前进

近日,一项关于单张图像快速重建3D模型的新技术取得了突破。该技术基于高斯飞溅技术,通过学习性技术将图像中的每个像素映射到一个3D高斯函数中,从而实现单张图像的3D重建。这一技术的创新点在于引入了“飞溅图像”,...

Read More
2023-12-07 talkingdev

谷歌通过SDXL技术实现图文风格一致性

谷歌最近基于SDXL技术推出了一项令人惊叹的工作,该工作通过多代人的注意力共享来维护一致的样式。这种方法至关重要的是不需要进行任何微调。

Read More
2023-11-29 talkingdev

360度全景成像混合技术实现开源

研究人员已经设计出一种独特的圆形混合方法来解决创建无缝360度全景图像的长期难题。这种技术是他们从文本和单张图像生成全景图像的创新模型的关键特征。

Read More
  1. Prev Page
  2. 22
  3. 23
  4. 24
  5. Next Page