漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-06-29 talkingdev

3D-Speaker:一个庞大的语音数据集

3D-Speaker是一个庞大的音频数据集,包含来自10000多个说话者的录音数据,这些录音数据是在不同设备上、各种距离和多种方言下录制的。这个数据集有助于研究人员解析语音的不同方面,并非常适合用于测试大型语音模型...

Read More
2023-06-30 talkingdev

FunQA:专注于惊喜内容的视频问答数据集

FunQA是一个创新的数据集,旨在测试和提升模型对令人惊喜的视频的理解能力,例如幽默或创意视频片段,推动模型在时间戳定位、视频描述和推理等领域的能力。

Read More
2023-06-30 talkingdev

自己的数据上评估LLM的性能

语言模型的性能通常是在一个非常小的筛选数据集上进行评估的。这些数据的分布往往从生产环境中大大简化。使用自我监督评估,您可以使用自己的数据集来评估这些模型。您甚至可以使用从生产环境中流入的数据。

Read More
2023-06-30 talkingdev

FiftyOne:加速机器学习工作流程的利器

FiftyOne是一个强大的工具,可以通过更快、更有效地可视化数据集和解释模型来加速机器学习工作流程。它提供了直观的界面,让用户能够轻松地浏览、筛选和分析数据集。此外,FiftyOne还提供了一系列功能,如数据集的统...

Read More
2023-06-26 talkingdev

embedchain:一个用于创建基于大型语言模型的聊天机器人的框架

embedchain是一个用于创建基于大型语言模型的聊天机器人的框架。它抽象了加载数据集、分块、创建嵌入和存储到向量数据库的整个过程。用户可以通过链接到媒体文件,如视频、PDF、博客文章或网站,创建聊天机器人。这...

Read More
2023-06-23 talkingdev

FlagAI:快速、易用且可扩展的大规模通用人工智能模型工具包开源

FlagAI(Fast Large-scale General AI models)是一个快速、易于使用且可扩展的大规模模型工具包。它提供了一整套功能强大的工具和库,用于开发和部署大规模人工智能模型。FlagAI的设计目标是使开发人员能够快速构建...

Read More
2023-06-22 talkingdev

开源STL:标准化时空预测学习的GitHub仓库

本仓库介绍了OpenSTL,这是一个基于过去帧预测未来模式的模型基准。它对不同数据集上的方法进行分类和评估。

Read More
2023-06-21 talkingdev

Autolabel:自动标注工具开源

Autolabel是一个Python库,可以使用你选择的任何大型语言模型(LLM)来标注、清理和丰富文本数据集

Read More
  1. Prev Page
  2. 40
  3. 41
  4. 42
  5. Next Page