漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-21 talkingdev

微软Copilot通过与GenAI音乐应用Suno的集成,获得音乐创作功能

微软Copilot是一款基于人工智能的代码辅助工具,能够快速生成代码,提高开发效率。近日,微软宣布Copilot将与GenAI音乐应用Suno进行集成,获得音乐创作功能。通过这一功能,Copilot可以帮助音乐人快速生成和编辑歌曲...

Read More
2023-12-21 talkingdev

TokenAny-可对任何事物进行标记

近日,GitHub仓库上线了一款全新的模型,可同时进行图像分割、识别和标注,超越了之前的能力。这个新模型的优势在于可以标记任何事物,不再局限于传统的图像和文本。目前,该模型已经在多个领域得到了广泛的应用,包...

Read More
2023-12-21 talkingdev

M3DBench-全面的3D指令跟踪数据集发布

M3DBench是一个全新的广泛数据集,旨在改变AI的3D理解,填补多模态语言模型研究中的差距。它包括超过320,000个不同的指令响应对,集成了文本、图像和3D对象,为AI执行更广泛的现实3D任务铺平了道路。

Read More
2023-12-21 talkingdev

可靠机器人公司完成无人机试飞,实现无人配送

可靠机器人公司成功完成了一架货运无人机的试飞。这架飞机来自联邦快递公司,试飞总共持续了12分钟。这已经是可靠机器人公司的第二次自动试飞。该初创公司正在努力获得美国联邦航空局的全面批准。其系统将限制远程飞...

Read More
2023-12-21 talkingdev

LLMLingua-对齐后的LLM检测提示中的无关标记,实现对黑盒LLM的压缩推理

近日,一项名为LLMLingua的新项目在GitHub上开源。该项目使用对齐后的小型语言模型检测提示中的无关标记,并实现对黑盒LLM的压缩推理,从而实现了高达20倍的压缩比,且性能损失最小。简言之,LLMLingua能够帮助开发...

Read More
2023-12-21 talkingdev

Distil Whisper:新的语音识别技术比 Whisper 更快、更小、误差不到1%

Distil-Whisper 是 Whisper 的精简版本,比 Whisper 更快、更小,且在评估集上的误差不到1%。该技术是由 Google Brain 团队在 GitHub 上发布的。Distil-Whisper 采用了一些精简技术,包括低秩分解和知识蒸馏,以实现...

Read More
2023-12-21 talkingdev

STSSNet,增强型实时渲染项目

该项目介绍了时空超采样(STSS),这是一个显著改进实时渲染高分辨率、高帧率内容的框架。该项目已在GitHub上发布,用户可以从中获取源代码并进行使用。

Read More
2023-12-21 talkingdev

论文:利用卷积神经网络进行深度伪造检测

本研究提出了一种深度学习方法,利用四个预训练的卷积神经网络模型来识别视频中的深度伪造人脸,可实现高精度检测。深度伪造技术已成为一种严重的威胁,对政治、社会和经济稳定造成了巨大的影响。该研究提出的方法可...

Read More
  1. Prev Page
  2. 817
  3. 818
  4. 819
  5. Next Page