漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-06-29 talkingdev

3D-Speaker:一个庞大的语音数据集

3D-Speaker是一个庞大的音频数据集,包含来自10000多个说话者的录音数据,这些录音数据是在不同设备上、各种距离和多种方言下录制的。这个数据集有助于研究人员解析语音的不同方面,并非常适合用于测试大型语音模型...

Read More
2023-06-29 talkingdev

LightGlue:更智能快速的图像匹配技术(GitHub开源)

LightGlue是一种新技术,可以更轻松、更快速地找到图片之间的相似之处,甚至比当前最好的方法Superglue还要好。LightGlue最好的部分是它可以根据图像复杂度进行自适应,对于简单的图像可以更快地工作,在实时应用中...

Read More
2023-06-29 talkingdev

Salesforce开源新的70亿语言模型

Salesforce发布了一组新的语言模型,该模型在GitHub上公开发布。这些模型使用4K和8K序列长度进行了15亿个令牌的训练,参数量为70亿。与目前许多开源模型如MPT或Falcon相比,这些模型具有更好或相当的性能。此外,它...

Read More
2023-06-29 talkingdev

DeepMind开源FlamingoV2模型,可回答视觉问题

Flamingo是DeepMind的一个模型,可以处理图像和文本。它能够回答视觉问题,并具有强大的语言建模性能。这项工作是对这些模型的复制研究。它还使用了MPT和Red pajama基础模型,这些模型在许可使用上较为灵活。这个复...

Read More
2023-06-30 talkingdev

FunQA:专注于惊喜内容的视频问答数据集

FunQA是一个创新的数据集,旨在测试和提升模型对令人惊喜的视频的理解能力,例如幽默或创意视频片段,推动模型在时间戳定位、视频描述和推理等领域的能力。

Read More
2023-06-30 talkingdev

自己的数据上评估LLM的性能

语言模型的性能通常是在一个非常小的筛选数据集上进行评估的。这些数据的分布往往从生产环境中大大简化。使用自我监督评估,您可以使用自己的数据集来评估这些模型。您甚至可以使用从生产环境中流入的数据。

Read More
2023-06-30 talkingdev

FiftyOne:加速机器学习工作流程的利器

FiftyOne是一个强大的工具,可以通过更快、更有效地可视化数据集和解释模型来加速机器学习工作流程。它提供了直观的界面,让用户能够轻松地浏览、筛选和分析数据集。此外,FiftyOne还提供了一系列功能,如数据集的统...

Read More
2023-06-27 talkingdev

DeepMind声称其下一个聊天机器人将能与ChatGPT媲美

DeepMind的Gemini大型语言模型是使用AlphaGo的技术进行训练的,AlphaGo是第一个在围棋比赛中击败职业人类选手的AI系统。Gemini可以规划、解决问题和分析文本。它将AlphaGo类型系统的优势与大型语言模型的能力相结合...

Read More
  1. Prev Page
  2. 399
  3. 400
  4. 401
  5. Next Page