Llama的相关内容 - 漫话开发者

2026-03-07 talkingdev

开源|OBLITERATUS：一款旨在移除开源大语言模型审查限制的工具引发热议

近日，一个名为OBLITERATUS的开源项目在开发者社区及技术新闻平台Hacker News上引发了广泛关注与讨论。该项目由开发者elder-plinius在GitHub上发布，其核心目标是“粉碎束缚你的枷锁”，具体指向为移除或绕过开源、开...

2026-02-23 talkingdev

近日，在GitHub上开源名为“ntransformer”的高效大语言模型推理引擎项目，其核心创新在于探索并实现了通过NVMe存储设备直接与GPU通信，绕过CPU和系统内存的传统数据路径，从而在消费级显卡RTX 3090上成功运行了参数量...

2026-02-08 talkingdev

近日，开发者基于Rust语言重构了OpenClaw助手模式，推出了名为LocalGPT的本地化AI助手项目。该项目在四天内完成开发，编译后仅生成约27MB的单一可执行文件，无需依赖Node.js、Docker或Python环境，体现了轻量级与高...

2025-12-09 talkingdev

一项突破性的研究提出了一种无需任何人工偏好标注即可训练视觉语言模型评判者的全新框架。该框架的核心在于通过自我合成数据实现迭代式自训练，从而摆脱了对昂贵且易过时的人工标注的依赖。其工作流程分为三个阶段：...

2025-12-06 talkingdev

根据AI模型聚合平台OpenRouter发布的最新年度研究报告，通过对过去一年内超过100万亿个令牌（tokens）的实证分析，揭示了当前AI模型使用格局的重大转变。报告指出，以Claude 3.5 Sonnet、GPT-4o和o1系列为代表的“推...

2025-11-11 talkingdev

近日，前沿开源实验室Moonshot AI正式发布其新一代Kimi K2思维模型，该模型采用混合专家架构，具备320亿激活参数与1万亿总参数的庞大规模。在技术性能方面，Kimi K2在前沿知识理解、数学推理及代码生成领域均达到当...

2025-10-21 talkingdev

在构建面向Usul AI和企业客户的大规模检索增强生成（RAG）系统过程中，开发者处理了超过1300万页文档的实践经验揭示了关键洞见。初期使用Langchain和LlamaIndex框架虽能快速验证概念，但在实际生产环境中处理海量数...

2025-10-14 talkingdev

业界瞩目的开源AI推理基准测试工具InferenceMAX正式亮相，该工具通过夜间自动化测试对Llama 70B、DeepSeek R1等主流大模型进行持续性能评估。其核心价值在于量化AI推理中的关键权衡：吞吐量（每GPU每秒处理令牌数）...