LLaMA的相关内容 - 漫话开发者

2025-03-28 talkingdev

本地运行DeepSeek RAG：结合Elasticsearch、Ollama和Kibana的完整指南

近日，Elastic官方博客发布了一篇关于如何在本地环境中运行RAG（检索增强生成）系统的详细教程。该教程指导用户逐步安装Ollama并在容器中运行，随后将其连接到Kibana可视化平台，最终实现基于DeepSeek R1模型的本地R...

2025-03-18 talkingdev

MMS-LLaMA是一款高效的多模态语音大语言模型框架，专注于自动视觉语音识别（AVSR），在优化标记长度的同时保留了语言内容。该框架通过整合视觉和语音数据，提供了一种全新的方法来提升语音识别的准确性和效率。MMS-L...

2025-03-14 talkingdev

Nous Research近日推出了Inference API，旨在为开发者和研究人员提供其个性化的、无限制的语言模型访问权限。该API支持两种模型：Hermes 3 Llama 70B和DeepHermes-3 8B Preview，并通过候补名单系统管理需求，增加其...

2025-03-04 talkingdev

Llama Stack 定义并标准化了将生成式AI应用推向市场所需的核心构建模块。这些构建模块以可互操作的API形式呈现，并由广泛的提供商提供其实现。它们被组装成易于开发者从零到生产的发行版。Llama Stack 的目标是简化...

2025-02-27 talkingdev

Hazy Research的最新研究表明，通过Ollama使用本地模型，并结合长上下文云端模型作为协调器，可以在仅花费17%成本的情况下，实现97%的任务性能。这一发现为企业在AI部署中提供了更高效、更经济的解决方案。本地模型...

2025-02-21 talkingdev

近日，GitHub上出现了一款名为OllamaTalk的开源项目，该项目基于Flutter框架开发，旨在为Ollama提供一个简洁易用的前端界面。OllamaTalk的设计理念是简化用户与Ollama的交互过程，使其更加直观和高效。通过Flutter的...

2025-02-21 talkingdev

DeepEval是一个开源框架，专注于评估和测试大型语言模型系统。它整合了最新的研究成果，通过本地运行的模型来评估模型输出。DeepEval支持通过RAG、微调、LangChain、LlamaIndex等多种方式实现的应用。该框架可帮助开...

2025-01-28 talkingdev

近日，GitHub Gist上发布了一个关于Llama推理模型的最小化工作复现版本。该模型最初由OpenAI提出，并由DeepSeek发布。该模型通过数学问题的格式和正确性奖励进行训练，展示了在长时间训练后出现的“顿悟”时刻。这一进...