Llama的相关内容 - 漫话开发者

2026-06-05 talkingdev

开源|Ollama Model Tester：一键对比本地大模型性能的CLI工具

随着本地大语言模型（LLM）的普及，Ollama作为一款简洁的本地模型运行工具，受到开发者和研究者的广泛关注。然而，面对众多不同参数规模、训练策略的Ollama模型，如何快速、客观地选出最适合特定任务的模型，成为实...

2026-06-04 talkingdev

近日，一个名为Mnemo的开源项目在GitHub上引起了开发者社区的广泛关注。该项目旨在为任何大型语言模型（LLM）提供一个本地优先的人工智能记忆层。Mnemo的核心创新在于，它摒弃了传统依赖云端或外部API的记忆管理方式...

2026-05-28 talkingdev

在AI和文档处理领域，PDF解析一直是一个棘手但关键的环节。近日，LlamaIndex团队推出的LiteParse v2.0版本引发了开发者社区的广泛关注。该项目完全采用Rust语言从零重写，彻底摆脱了对大语言模型（LLM）或云端服务的...

2026-04-22 talkingdev

近日，GitHub上开源了一个名为GoModel的高性能AI网关项目，该项目使用Go语言编写，旨在为开发者提供一个统一的、兼容OpenAI API标准的接口，以无缝对接包括OpenAI、Anthropic（Claude）、Google Gemini、Groq、xAI（...

2026-04-07 talkingdev

Meta公司正加速推进其新一代人工智能模型的发布进程。据最新报道，该公司即将推出的一系列AI模型中，部分将最终以开源许可证的形式向公众开放。这一举措延续了Meta此前通过Llama系列模型所践行的开源路线。公司首席...

2026-04-06 talkingdev

一项名为‘简单自蒸馏’（Simple Self-Distillation, SSD）的新方法为大语言模型的代码生成能力提升开辟了一条高效且成本低廉的路径。该方法的核心在于，仅利用模型自身在特定采样配置（如温度参数和截断策略）下生成...

2026-04-02 talkingdev

富士通研究院近日开源了名为“OneCompression”（简称OneComp）的Python库，这是一个专门用于大语言模型后训练量化的工具。该库集成了当前最先进的量化算法，包括GPTQ和DBF，旨在帮助开发者和研究人员高效地将庞大的LL...

2026-03-23 talkingdev

近日，GitHub上出现了一个名为Project N.O.M.A.D.（Node for Offline Media, Archives, and Data）的开源项目，它是一款自包含、优先离线的知识服务器，旨在为用户提供无需互联网连接的工具、教育资源和人工智能能力...