HuggingFace的相关内容 - 漫话开发者

2024-01-25 talkingdev

Nano ColBERT：最新开源检索嵌入模型

ColBERT是用于检索的较好的嵌入模型之一。由于许多人正在构建启用RAG的人工智能应用程序，因此值得探索和使用。这个实现是一个简单和直接的复制，没有性能优化和它们所增加的复杂性。它使用HuggingFace的BERT，但实...

2024-01-23 talkingdev

HuggingFace发布了Datatrove，这是一个用于过滤大型文本数据集的库。它具有许多有用的原语和用于文本过滤的完整并行管道。可在C4中使用Gopher质量过滤器的示例。

2024-01-23 talkingdev

近日，HuggingFace发布了一个名为Nanotron的小型而强大的库，用于训练具有3D并行性的模型。这意味着它将数据、模型和模型中的层/张量分割开来。前两种并行性在PyTorch等库中得到了很好的支持。然而，将模型张量分割...

2024-01-22 talkingdev

Meta最近推出了一系列令人难以置信的音乐和声音生成模型，并发布了推理代码。这些模型是通过机器学习训练的，可以生成高质量的音乐和声音效果。该公司表示，这些模型可以用于广泛的应用场景，包括游戏声音、虚拟现实...

2024-01-22 talkingdev

HuggingFace于近日发布了Haiku DPO数据集，旨在帮助AI模型写出正确的日本俳句。该数据集由多位专业诗人参与标注，包含数千条俳句及其正确的音律和形式，涵盖了从传统到现代的各个风格。据悉，该数据集可以用于训练和...

2024-01-11 talkingdev

谷歌的开关Transformer是最早成功的专家混合模型之一。现在，该模型的代码已经在HuggingFace平台上发布，供人们使用。

2024-01-08 talkingdev

MUSE是一种使用Transformers的掩蔽图像生成模型。HuggingFace和Stability AI已经合作开源复现该模型，并发布了训练代码、模型检查点和论文。虽然这些模型的训练时间不如一些最好的图像扩散模型长，但它们显示出了很...

2023-12-15 talkingdev

微软的最新模型现已在HuggingFace上提供研究用途。Phi-2是一种基于Transformers的语言生成模型，它被训练用于生成各种文本，包括问答、对话和自然语言生成。该模型采用的是自回归模式，即在生成下一个单词或字符时，...