LLM的相关内容 - 漫话开发者

2023-10-03 talkingdev

流媒体LLM：一种理论上可以支持无限上下文窗口大小的语言模型算法更新

语言模型的性能往往受到其上下文长度的限制。一般来说，上下文长度的限制主要源于计算硬件和聪明的算法更新。StreamingLLM（Github Repo）提供了一种算法更新，通过将令牌流式传输至注意力机制，理论上可以支持无限...

2023-10-02 talkingdev

Dataiku近日发布了LLM Mesh，以解决在企业中集成LLM的有效、可扩展、安全平台的紧迫需求。LLM Mesh位于LLM服务提供商和最终用户应用之间，公司可以根据自己的需求选择最具成本效益的模型，以确保其数据和响应的安全...

2023-10-02 talkingdev

随着越来越多的新模型问世，寻找一种能够轻松拉取并运行这些模型的方法变得具有挑战性。而且，重新混合和制作这些模型也不是一件容易的事情。然而，这款名为Ollama的小工具让测试最新模型变得简单。这款工具具有用户...

2023-09-29 talkingdev

Metaphor的API使您的LLMs能够连接到互联网，从而实现强大的搜索和研究功能。只需几行代码，您就可以获得高质量的搜索结果以及即时的HTML内容。Metaphor的这款产品不仅简化了开发者的工作流程，也将大大提高用户的在...

2023-09-28 talkingdev

大型语言模型在许多设备上的运行效率受限于其庞大的计算需求。然而，一个名为QA-LoRA的新方法已经成功改变了这一局面。QA-LoRA通过巧妙地改变模型的构建和微调方式，使得大型语言模型能够在维持强大功能的同时，有效...

2023-09-26 talkingdev

DeepEval是一个提供Pythonic方式进行离线评估的工具，专为LLM（语言模型）流水线设计。使用DeepEval，开发者能够在部署到生产环境之前，对其LLM流水线进行深度和全面的评估。这大大降低了生产环境中出现错误的风险，...

2023-09-25 talkingdev

语言模型在训练过程中，通常会遇到一种情况，即当模型训练的内容是“A是B”时，它并不能自动推断出“B是A”。这一发现对当前的语言模型（LLMs）提出了挑战和质疑，因为我们通常会期待模型能够自动推断出这样的逻辑关系。...

2023-09-25 talkingdev

Haystack，一款在GitHub上拥有10,785颗星的开源项目，提供了快速设计和构建可扩展、API驱动的LLM后端所需的一切工具。此开源框架的主要功能是可以帮助开发人员快速构建出高效且可靠的应用程序。通过使用Haystack，开...