漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-06 talkingdev

AnimateLCM-高保真视频生成技术实现高质量视频创作

AnimateLCM是一种新的方法,可以通过将学习过程分成两部分来快速创建高质量的视频和改进现有的视频扩散模型。AnimateLCM的第一步是利用低复杂度的运动补偿技术来生成一个低质量的视频序列。 然后,利用一个基于自适...

Read More
2024-02-05 talkingdev

GPTNewspaper开源:6个代理协同工作,打造一份自动化报纸

近日,一款名为GPTNewspaper的开源项目在GitHub上发布。该项目利用了自然语言处理技术,通过6个代理协同工作,实现了报纸的自动化生成。这6个代理分别是:检索代理、摘要代理、文章代理、编辑代理、格式代理和排版代...

Read More
2024-02-02 talkingdev

微软利用激光技术解决LLM幻觉问题

1月份微软研究论坛上,Dipendra Misra提出了一种名为“Layer-Selective Rank Reduction(LASER)”的技术,通过用一个较小的近似矩阵替换权重矩阵,提高了大型语言模型(LLM)的准确性。

Read More
2024-01-30 talkingdev

Stori AI:让你的创意变成引人注目的品牌推文

Stori AI是一家专注于提供社交媒体视觉内容服务的公司。近日,Stori AI推出了全新的产品,该产品可以将用户的创意转化为视觉上具有吸引力的品牌社交帖文。这个产品利用了人工智能和机器学习技术,可以自动为用户生成...

Read More
2024-01-30 talkingdev

论文:医学视频分割技术实现突破

医学视频中的目标分割一直是医学影像处理的难点之一。近日,研究人员提出了一种名为 Vivim 的新型医学视频目标分割框架,该框架通过采用状态空间模型的方法对时空数据进行高效压缩,从而在更短的时间内实现更加准确...

Read More
2024-01-22 talkingdev

WhisperSpeech: 倒置Whisper技术实现的文本转语音系统

WhisperSpeech是一种倒置Whisper技术实现的文本转语音系统。该系统目前仅在英语LibreLight数据集上进行了训练,但未来的版本将面向多种语言。在该仓库中提供了合成语音的示例。

Read More
2024-01-17 talkingdev

Meta新技术,实现语音克隆和翻译无缝衔接

Meta最近展示了一项新的技术,可以实现语音克隆和翻译的无缝衔接。该技术使用深度学习和自然语言处理等技术,可以在不改变说话者声音和语调的情况下,将一种语言翻译成另一种语言。这种技术将为多语种交流和语言学习...

Read More
2024-01-12 talkingdev

Potis AI:利用AI技术实现自动化面试

近日,Potis AI在一场新品发布会上推出了一款基于人工智能技术的自动行为面试产品。该产品通过AI算法分析应聘者的语音、面部表情、姿态等信息,快速评估其职业素养、人际交往能力、团队协作能力等关键能力,大大提高...

Read More
  1. Prev Page
  2. 9
  3. 10
  4. 11
  5. Next Page