大型语言模型(LLM)在生产环境中的行为监控已成为AI工程化的重要挑战。为应对这一难题,业界引入了AI评估栈(AI Evaluation Stack),将测试分为确定性断言(如语法和路由完整性)与基于模型的评估(如语义质量)。...
Read More近日,GitHub上出现了一个名为‘claude-token-efficient’的开源项目,其核心是引入一个名为‘Universal CLAUDE.md’的配置文件方案。该项目宣称,通过简单的‘即插即用’方式,无需对现有代码进行任何修改,即可将Anthrop...
Read More近日,开发者jmuncor在GitHub上开源了一个名为Sherlock的工具,它是一个专门用于拦截和可视化大型语言模型API流量的中间人代理。该工具源于开发者对Claude Code等AI开发工具实际API通信内容的好奇心。Sherlock部署在...
Read More近日,Bolt Foundry在GitHub上开源了名为Gambit的代理(Agent)框架,旨在解决当前大型语言模型(LLM)工作流开发中普遍存在的痛点。该框架通过引入“牌组”(decks)这一核心概念,将工作流分解为小型、强类型的可组...
Read More近日,开源社区迎来一款突破性的图数据库FalkorDB,该数据库底层采用GraphBLAS技术实现稀疏邻接矩阵图表示,展现出卓越的性能表现。作为专门针对大语言模型优化的知识图谱解决方案,FalkorDB旨在为GraphRAG(图检索...
Read MoreButter是一项专注于优化大型语言模型(LLM)应用成本与效率的前沿技术解决方案。它通过智能缓存机制识别并重复调用相同的LLM响应,显著降低AI系统的运营成本,同时增强其输出的确定性。该技术与OpenAI等主流聊天补全...
Read More近日,GitHub上开源项目TOON(Token-Oriented Object Notation)引发开发者社区广泛关注。这一由开发者johannschopplich推出的新型数据格式,专为大语言模型(LLM)输入优化设计,通过精简的结构化数据表示方式,显...
Read MoreOpenAI正式推出Apps SDK开发框架,为开发者提供构建ChatGPT专属应用的核心工具链。该框架通过标准化接口封装了对话管理、上下文控制和多模态交互能力,支持快速集成知识库检索、工作流编排等企业级功能。技术文档显...
Read More