漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-31 talkingdev

CoTrack,Meta开源的密集视频跟踪工具

在众多的密集像素跟踪工具中,许多在面对遮挡或者快速运动时都会失效。然而,Meta的这项工作却展现出了强大的功能,其工具不仅运行速度快,而且易于使用。或许现在有人可以重新创建视频涂鸦了?CoTrack的出现填补了...

Read More
2023-08-31 talkingdev

BatteryML:微软开源电池退化研究模型工具包

近日,一款名为「BatteryML」的开源工具包在技术圈内引起了广泛的关注。该工具包主要用于电池退化方面的研究,包括数据集、特征工程工具,以及一个模型库。它提供了一种全新的方式来研究和理解电池退化的过程,为电...

Read More
2023-08-31 talkingdev

Spatio-Temporal,一种提升3D人体姿态检测的新方法开源

现有的理解3D人体姿态的方法主要关注的是身体各部分在空间中的关系,但往往忽略了它们随着时间的变化。这种新方法同时考虑了空间和时间,使其在理解姿态方面,特别是身体某些部分被遮挡或不清晰的时候,表现得更为优...

Read More
2023-08-30 talkingdev

开源工具DSPy:可提升语言模型的理解和学习能力

GitHub近日发布了新工具DSPy,这是一套简洁的Python模块集,能够统一调动和微调语言模型(LMs)的技术,并通过推理和工具/检索增强来改进它们。DSPy的设计理念是使得这些复杂的技术可以通过简洁的代码实现,同时也使得...

Read More
2023-08-30 talkingdev

LangFuse开源:LLM应用的观察和分析解决方案

LangFuse是一种为LLM(低延迟的消息)应用设计的开源可观察性和分析解决方案。它主要针对生产环境使用,但也有一些用户在本地开发他们的LLM应用时使用。LangFuse的主要目标是提供实时的、深入的、可操作的见解,以帮...

Read More
2023-08-30 talkingdev

持续监控WebAssembly代码的Observe工具开源

Observe是一个开源工具,它可以在运行时内部对WebAssembly代码进行连续监控。

Read More
2023-08-29 talkingdev

开源视觉-语言模型:识别面部表情

本研究公开了一个新的模型-DFER-CLIP,该模型对CLIP模型进行了改进,专门用于识别现实世界中变化的面部表情。CLIP模型是一个多模态的人工智能模型,它能够理解图像和文本之间的关系。这个新的DFER-CLIP模型,通过增...

Read More
2023-08-29 talkingdev

AudioLDM2-声音与音乐生成模型开源

近日,一款出色的开源声音与音乐生成模型在GitHub上引发关注。这款模型运行速度快,能生成节拍、音效和基础对话。操作简单,且对提示样式具有较强的鲁棒性。该模型的出现,无疑为音频处理领域的发展注入了新的活力,...

Read More
  1. Prev Page
  2. 162
  3. 163
  4. 164
  5. Next Page