LLM应用的相关内容 - 漫话开发者

2026-04-27 talkingdev

监控LLM行为：漂移、重试与拒绝模式解析

大型语言模型（LLM）在生产环境中的行为监控已成为AI工程化的重要挑战。为应对这一难题，业界引入了AI评估栈（AI Evaluation Stack），将测试分为确定性断言（如语法和路由完整性）与基于模型的评估（如语义质量）。...

2026-03-31 talkingdev

近日，GitHub上出现了一个名为‘claude-token-efficient’的开源项目，其核心是引入一个名为‘Universal CLAUDE.md’的配置文件方案。该项目宣称，通过简单的‘即插即用’方式，无需对现有代码进行任何修改，即可将Anthrop...

2026-01-29 talkingdev

近日，开发者jmuncor在GitHub上开源了一个名为Sherlock的工具，它是一个专门用于拦截和可视化大型语言模型API流量的中间人代理。该工具源于开发者对Claude Code等AI开发工具实际API通信内容的好奇心。Sherlock部署在...

2026-01-16 talkingdev

近日，Bolt Foundry在GitHub上开源了名为Gambit的代理（Agent）框架，旨在解决当前大型语言模型（LLM）工作流开发中普遍存在的痛点。该框架通过引入“牌组”（decks）这一核心概念，将工作流分解为小型、强类型的可组...

2025-11-29 talkingdev

近日，开源社区迎来一款突破性的图数据库FalkorDB，该数据库底层采用GraphBLAS技术实现稀疏邻接矩阵图表示，展现出卓越的性能表现。作为专门针对大语言模型优化的知识图谱解决方案，FalkorDB旨在为GraphRAG（图检索...

2025-10-29 talkingdev

Butter是一项专注于优化大型语言模型（LLM）应用成本与效率的前沿技术解决方案。它通过智能缓存机制识别并重复调用相同的LLM响应，显著降低AI系统的运营成本，同时增强其输出的确定性。该技术与OpenAI等主流聊天补全...

2025-10-28 talkingdev

近日，GitHub上开源项目TOON（Token-Oriented Object Notation）引发开发者社区广泛关注。这一由开发者johannschopplich推出的新型数据格式，专为大语言模型（LLM）输入优化设计，通过精简的结构化数据表示方式，显...

2025-10-07 talkingdev

OpenAI正式推出Apps SDK开发框架，为开发者提供构建ChatGPT专属应用的核心工具链。该框架通过标准化接口封装了对话管理、上下文控制和多模态交互能力，支持快速集成知识库检索、工作流编排等企业级功能。技术文档显...