漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-20 talkingdev

Databricks收购Lilac以加强自然语言处理能力

数据分析和人工智能领域的领先企业Databricks近日宣布,已经完成了对Lilac公司的收购。Lilac是一家专注于无监督语言数据集构建系统的公司,此次收购将进一步加强Databricks在自然语言处理(NLP)领域的技术实力。Lil...

Read More
2024-03-18 talkingdev

HuggingFace开放财报电话会议问答数据集

HuggingFace Hub最近发布了一个新的数据集,该数据集包含了从财报电话会议中转录的精选问答对。这个数据集对于研究人员和开发者来说是一个宝贵的资源,因为它提供了实际的业务沟通场景中的自然语言处理样本。这些问...

Read More
2024-03-07 talkingdev

Vision-RWKV:处理高分辨率图像任务的高效模型

Vision-RWKV将NLP中的RWKV架构应用于视觉任务,为高分辨率图像处理提供了一个高效的解决方案。RWKV是一种基于注意力机制的架构,它在处理序列数据时表现出色,而Vision-RWKV则将其成功地应用于图像领域。该模型的表...

Read More
2024-03-07 talkingdev

如何为LLM优化技术文档

本文讨论如何为大型语言模型构建结构化文档,以及在整个过程中需要考虑的最佳实践。首先,为LLM编写文档时应当注意文档的结构及可读性。其次,可以通过提供示例代码、使用清晰的术语和概念以及清晰的语言来使文档更...

Read More
2024-02-13 talkingdev

SPIN-自我博弈的微调训练方法开源

自然语言处理(NLP)中,让语言模型生成自己的训练数据是一个具有挑战性但前景广阔的研究领域。SPIN是一种方法,已经显示出很大的前途。该代码已经发布,但据报道使用起来很有挑战性。

Read More
2024-01-10 talkingdev

开源LLM Gateway,实现多语言模型之间的路由

Portkey AI最近开源了LLM Gateway,实现了多个不同语言模型之间的路由。这个开源项目旨在简化在不同的语言模型之间进行选择和路由的过程,从而更好地利用不同模型的优势,提高语言模型的整体性能。 LLM Gateway是一...

Read More
2023-11-23 talkingdev

3分钟内部署任何GGUF模型

使用llama.cpp和GGUF服务器,您可以非常快速地部署一个服务于HuggingFace托管模型的端点。这意味着您可以在几分钟内将HuggingFace的最新自然语言处理模型部署到生产环境中。

Read More
2023-10-31 talkingdev

Magnetic:轻松将LLM集成到您的Python中

Magnetic是一个用于轻松集成大型语言模型到Python代码的库。 这个名为Magnetic的库是由NLP引擎提供商Hugging Face发布的。基于Transformers,Magnetic允许您轻松地将大型语言模型集成到您的Python代码中,以进行各种...

Read More
2023-10-27 talkingdev

论文:LLM模型中的4位量化技术

本研究介绍了LLM-FP4,这是一种新的方法,通过在训练后将大型语言模型的权重和操作转换为4位浮点值来压缩它们。近年来,由于NLP任务的快速发展,语言模型的大小和计算需求不断增加,这给模型的部署和使用带来了很多...

Read More
2023-10-20 talkingdev

自然语言处理世界:全面分类体系解读

本研究介绍了一种详细的分类系统,以了解自然语言处理中的泛化研究。这项研究为NLP专业人士提供了一个全面的分类方法,帮助他们更好地理解该领域的研究。该分类体系基于泛化领域,包括词向量、句子分类、命名实体识...

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3
  5. Next Page