漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-22 talkingdev

Apple 研究员开发突破性技术,让 iPhone 运行 LLMs 如虎添翼

苹果研究员使用一种创新的闪存利用技术,为在具有有限内存的苹果设备上部署大型语言模型打开了关键突破。该方法使用窗口化和行列捆绑技术来最小化数据传输,最大化闪存吞吐量。它使得 AI 模型在标准处理器上运行速度...

Read More
2023-12-21 talkingdev

Distil Whisper:新的语音识别技术比 Whisper 更快、更小、误差不到1%

Distil-Whisper 是 Whisper 的精简版本,比 Whisper 更快、更小,且在评估集上的误差不到1%。该技术是由 Google Brain 团队在 GitHub 上发布的。Distil-Whisper 采用了一些精简技术,包括低秩分解和知识蒸馏,以实现...

Read More
2023-12-21 talkingdev

论文:利用卷积神经网络进行深度伪造检测

本研究提出了一种深度学习方法,利用四个预训练的卷积神经网络模型来识别视频中的深度伪造人脸,可实现高精度检测。深度伪造技术已成为一种严重的威胁,对政治、社会和经济稳定造成了巨大的影响。该研究提出的方法可...

Read More
2023-12-21 talkingdev

VideoPoet:谷歌语言模型在视频创作中大放异彩

Google的VideoPoet是一种开创性的语言模型,它在处理文本到视频,视频风格化甚至视频到音频转换等多种任务方面具有独特的能力。这种方法通过将多种视频生成技术融合到一个模型中而脱颖而出。VideoPoet的革命性技术为...

Read More
2023-12-21 talkingdev

AI法律初创公司Harvey获得8000万美元B轮融资

AI法律初创公司Harvey AI利用OpenAI技术开发的一种法律服务,已经获得了另一轮融资,其估值超过7亿美元。该初创公司使用OpenAI构建基础模型,用于法律和法律实践应用。

Read More
2023-12-20 talkingdev

Facts网站开发AI驱动的产品研究工具

近日,&Facts网站发布了一款基于人工智能技术的产品研究工具,为DTC品牌提供更准确、快速的产品研究服务。该工具使用AI技术,可实现对DTC品牌产品的快速检索和分析,为品牌提供更多的市场竞争情报。此工具可帮助DTC...

Read More
2023-12-20 talkingdev

Amphion-开源多媒体资源生成工具包

Amphion是一款新的媒体生成工具包,支持音乐和语音,并且团队正在努力添加更多的模型。该工具包基于开源技术,可自由使用和修改。

Read More
2023-12-20 talkingdev

论文:SmooSeg,更优越的语义分割技术

本研究介绍了SmooSeg,这是一种新的方法,利用了图像中相邻特征往往共享相似含义的原则。SmooSeg的主要优点是提高了图像分割的准确性和速度。通过在训练过程中考虑相邻特征之间的关系,SmooSeg能够更好地理解图像的...

Read More
  1. Prev Page
  2. 531
  3. 532
  4. 533
  5. Next Page