近日,Elastic官方博客发布了一篇关于如何在本地环境中运行RAG(检索增强生成)系统的详细教程。该教程指导用户逐步安装Ollama并在容器中运行,随后将其连接到Kibana可视化平台,最终实现基于DeepSeek R1模型的本地R...
Read MoreMMS-LLaMA是一款高效的多模态语音大语言模型框架,专注于自动视觉语音识别(AVSR),在优化标记长度的同时保留了语言内容。该框架通过整合视觉和语音数据,提供了一种全新的方法来提升语音识别的准确性和效率。MMS-L...
Read MoreNous Research近日推出了Inference API,旨在为开发者和研究人员提供其个性化的、无限制的语言模型访问权限。该API支持两种模型:Hermes 3 Llama 70B和DeepHermes-3 8B Preview,并通过候补名单系统管理需求,增加其...
Read MoreLlama Stack 定义并标准化了将生成式AI应用推向市场所需的核心构建模块。这些构建模块以可互操作的API形式呈现,并由广泛的提供商提供其实现。它们被组装成易于开发者从零到生产的发行版。Llama Stack 的目标是简化...
Read MoreHazy Research的最新研究表明,通过Ollama使用本地模型,并结合长上下文云端模型作为协调器,可以在仅花费17%成本的情况下,实现97%的任务性能。这一发现为企业在AI部署中提供了更高效、更经济的解决方案。本地模型...
Read More近日,GitHub上出现了一款名为OllamaTalk的开源项目,该项目基于Flutter框架开发,旨在为Ollama提供一个简洁易用的前端界面。OllamaTalk的设计理念是简化用户与Ollama的交互过程,使其更加直观和高效。通过Flutter的...
Read MoreDeepEval是一个开源框架,专注于评估和测试大型语言模型系统。它整合了最新的研究成果,通过本地运行的模型来评估模型输出。DeepEval支持通过RAG、微调、LangChain、LlamaIndex等多种方式实现的应用。该框架可帮助开...
Read More近日,GitHub Gist上发布了一个关于Llama推理模型的最小化工作复现版本。该模型最初由OpenAI提出,并由DeepSeek发布。该模型通过数学问题的格式和正确性奖励进行训练,展示了在长时间训练后出现的“顿悟”时刻。这一进...
Read More