漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-22 talkingdev

MossFormer2模型在单声道语音分离方面取得新进展

MossFormer2模型是MossFormer的改进版,该模型在单声道语音分离方面具有更好的性能。在MossFormer2中,通过引入一个基于复数的非线性激活函数和一个基于深度可分离卷积的上下采样结构,从而提高了模型的分离能力。此...

Read More
2023-12-21 talkingdev

LLMLingua-对齐后的LLM检测提示中的无关标记,实现对黑盒LLM的压缩推理

近日,一项名为LLMLingua的新项目在GitHub上开源。该项目使用对齐后的小型语言模型检测提示中的无关标记,并实现对黑盒LLM的压缩推理,从而实现了高达20倍的压缩比,且性能损失最小。简言之,LLMLingua能够帮助开发...

Read More
2023-12-21 talkingdev

Distil Whisper:新的语音识别技术比 Whisper 更快、更小、误差不到1%

Distil-Whisper 是 Whisper 的精简版本,比 Whisper 更快、更小,且在评估集上的误差不到1%。该技术是由 Google Brain 团队在 GitHub 上发布的。Distil-Whisper 采用了一些精简技术,包括低秩分解和知识蒸馏,以实现...

Read More
2023-12-20 talkingdev

斯坦福发布新序列混合器

Mamba的创建者(以及许多其他模型)发布了一篇很专业的博客文章,概述了基本的序列混合架构,相对于标准Transformer,可以获得相当大的速度提升。该团队的新模型使用了这种混合方法,并且获得了非常好的性能。这种新...

Read More
2023-12-20 talkingdev

论文:图神经网络为节点分类提供更好的解决方案

研究人员开发了一种名为DSF的新方法,以改进谱图神经网络。通过引入节点特定的过滤器权重,DSF可以更好地处理像万维网这样的复杂网络。谱图神经网络(SGNN)是一种基于图的深度学习方法,它在节点分类、图分类和节点...

Read More
2023-12-20 talkingdev

英特尔发布新款AI芯片

英特尔推出了第五代至强处理器,专注于云、网络和边缘用例的人工智能能力。这些芯片是英特尔在Nvidia主导的AI加速器市场竞争中的一部分。英特尔表示,这些新款芯片将在性能、功耗和成本方面提供更高的价值,并能够满...

Read More
2023-12-19 talkingdev

AMD社区性能基准测试

MI300X是AMD的旗舰人工智能加速器。随着ROCm 6的推出,它现在在推理工作负载方面接近于NVIDIA的性能。这对社区来说是个好消息,因为它为新兴的人工智能公司打开了使用替代芯片的可能性。

Read More
2023-12-19 talkingdev

微调Mistral 7B在卡牌游戏中的应用

通过在魔法飞天卡牌游戏中进行微调实验,以提高GPT-4的性能,获得了一个精细调整的7B参数模型,其性能接近于人类水平。

Read More
2023-12-19 talkingdev

论文:使用语言模型提升自动驾驶能力

DriveMLM是一种新的框架,它使用大型语言模型来提高自动驾驶的能力。这个系统将语言决策与车辆控制相结合,不仅与现有的自动驾驶系统集成,而且在模拟中表现更好。

Read More
2023-12-19 talkingdev

Meta开放首个大规模第一人称视频数据集

视频理解是一个古老的领域,现在才开始获得成功。成功的主要推动因素是高质量的数据集。Meta的这项工作包括许多传感器数据源和手势。它为现有方法提供了基准性能

Read More
  1. Prev Page
  2. 65
  3. 66
  4. 67
  5. Next Page