原名为Adept的柿子科技公司,近期推出了其极其高效的8b参数模型——柿子-8B。同时,该公司也发布了推理代码。此次发布的模型和代码中包含了许多亮点,其中最引人注目的是具备70k未使用的嵌入功能,这为多模态扩展提供...
Read More本文讨论如何构建和扩展使用大型语言模型的应用程序。GitHub花费了三年时间,从想法到生产,开发了GitHub Copilot。该团队制定了一个三阶段计划进行开发:他们确定了LLM应用的有影响力的问题空间,创建了流畅的AI产...
Read More这项研究探讨了大型语言模型(LLMs)解决数学问题的能力,及各种不同因素如何影响它们的能力。研究人员发现,一种名为“拒绝采样精细调整”(Rejection sampling Fine-Tuning, RFT)的方法有助于这些模型在数学上的提...
Read More本文将详细介绍如何使用LLM CLI工具来简化对嵌入的操作。嵌入是机器学习和深度学习领域的一种重要技术,通常用于将高维数据转化为低维数据,以便于机器理解和处理。LLM CLI工具是专为嵌入设计的一款工具,可以帮助用...
Read Moreragas是一个框架,它可以帮助你评估你的检索增强生成(Retrieval Augmented Generation,简称RAG)管道,这是一类使用外部数据来增强LLM(语言模型学习)上下文的应用程序。RAG管道是近年来人工智能领域的重要研究方...
Read MoreLLM微调中心是一个包含代码和洞察的平台,专门用于微调各种大型语言模型以适应您的使用场景。不论您是开发者,还是研究人员,甚至是业务决策者,都可以在此找到有用的资源。通过微调,大型语言模型的性能可以得到显...
Read More本文将深入探讨几个主要的AI模型和相关问题。其中包括羊驼2模型,代码羊驼,GPT-4,聊天GPT的微调服务,LLM的扩展,前沿的AI模型,以及LLM的版权法规。羊驼2模型和代码羊驼是近年来AI领域的重要突破,它们的设计和实...
Read MoreLangFuse是一种为LLM(低延迟的消息)应用设计的开源可观察性和分析解决方案。它主要针对生产环境使用,但也有一些用户在本地开发他们的LLM应用时使用。LangFuse的主要目标是提供实时的、深入的、可操作的见解,以帮...
Read More