漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-08 talkingdev

30T多语言开放数据集发布

Red Pajama v2已发布。它比用于训练GPT-4的数据集大2.5倍。它包含5种语言的多语言数据,并具有令人印象深刻的广度。重要的是,已经完成了许多去重工作和一些启发式过滤工作,没有代码数据。

Read More
2023-11-07 talkingdev

AI数据管道遭受攻击

数据污染和其他数据管道攻击是网络安全界面临的巨大挑战,同时也是大多数AI组织的盲点。本文介绍了这些攻击的方式,并提供了代码以帮助未来进行缓解。AI数据管道遭受攻击可能会导致数据泄露,模型失效,模型被篡改等...

Read More
2023-11-07 talkingdev

基于Rust的矢量数据库Qdrant主打推荐功能

Qdrant是一个基于Rust语言开发的矢量数据库,它使用高速度的矢量检索技术来存储嵌入式向量。近日,Qdrant发布了一个名为“类似帖子”的新功能,它可以使用最相似的向量来搜索数据集。这个功能可以广泛应用于社交网络、...

Read More
2023-11-07 talkingdev

Video2Music开源,为视频生成量身定制的音乐

Video2Music的AI框架利用独特的数据集和经过用户研究验证的转换器模型为视频生成情感上相符的音乐。

Read More
2023-11-06 talkingdev

开源同理心语言模型,让心理咨询更亲切

研究人员通过创建同理心对话训练数据集的方式,改进了用于心理咨询的大型语言模型的同理心能力。该研究旨在使机器人咨询师更加亲切自然,增加用户的体验感和满意度。目前,该技术已在心理咨询机器人和智能客服中得到...

Read More
2023-11-03 talkingdev

论文:为情感化语言模型调参

研究人员通过创建一个情感对话训练数据集的方式,改进了用于心理咨询的大型语言模型的情感能力。

Read More
2023-11-02 talkingdev

只需1美元的算力,为Mistral进行微调

Mistral是一种基于深度学习的自然语言处理模型,其7B模型是目前最大的公开模型之一。现在,您可以使用Jupyter笔记本,根据自己的数据集对Mistral的7B模型进行微调,并仅需1美元的计算费用。微调Mistral模型可以提高...

Read More
2023-11-02 talkingdev

微软通过重大突破推动小型AI模型的界限

微软研究院已在其较小的语言模型Phi 1.5上增强了多模态能力,使其能够像OpenAI更大的GPT-4模型一样解释图像,但计算成本更低。Phi 1.5模型结合了文本和视觉信息,可以推断出对应的文本或图像。该模型在多个数据集上...

Read More
2023-10-27 talkingdev

分布式映射:在HuggingFace数据集上的实现方法

数据集映射是将转换应用于每个数据点的标准方法。但是在多个GPU上同时进行映射是很困难的。本代码提供了在HuggingFace数据集上实现的优秀函数。

Read More
2023-10-27 talkingdev

RGM,一种多功能的图像像素匹配方法

研究介绍了RGM(Robust Generalist Matching),这是一种专为图像中的稀疏和密集像素匹配而设计的深度学习模型。该方法利用了一种独特的级联GRU模块和一个新的大规模数据集。该模型可以应用于多种场景,具有广泛的适...

Read More
  1. Prev Page
  2. 17
  3. 18
  4. 19
  5. Next Page