大型语言模型(LLM)在生产环境中的行为监控已成为AI工程化的重要挑战。为应对这一难题,业界引入了AI评估栈(AI Evaluation Stack),将测试分为确定性断言(如语法和路由完整性)与基于模型的评估(如语义质量)。...
Read More近日,GitHub上开源了一个名为GoModel的高性能AI网关项目,该项目使用Go语言编写,旨在为开发者提供一个统一的、兼容OpenAI API标准的接口,以无缝对接包括OpenAI、Anthropic(Claude)、Google Gemini、Groq、xAI(...
Read More近日,一个名为Agents Observe的开源项目在GitHub上发布,为基于Claude Code的智能体开发提供了强大的实时可观测性解决方案。该项目本质上是一个实时仪表盘,能够通过钩子(hooks)捕获智能体运行过程中的每一个动作...
Read More在当今API驱动的微服务架构中,Webhooks作为实现实时、异步通信的关键技术,已成为现代应用开发的标配。然而,许多开发团队,包括知名金融科技公司Brex的经验所示,尽管深知Webhooks的必要性,却常因开发资源(带宽...
Read More欧洲领先的医疗科技公司Doctolib近期分享了其在移动端构建可靠AI聊天功能的实践经验。该公司最初以医疗预约应用起家,近年来正转型为更全面的健康伴侣平台。在开发过程中,团队发现构建移动端AI聊天功能比预期更具挑...
Read More知名软件公司37signals近日正式开源了其内部使用的合成监控系统Upright。该系统被设计为一个Rails引擎,用于监控包括Basecamp、HEY、Fizzy在内的公司核心产品线。Upright的技术架构颇具亮点,它通过Kamal部署到全球...
Read More近日,GitHub上开源了一个名为Slowmo的工具项目,它旨在为开发者提供对网页内容时间的通用控制能力。通过该工具,用户可以灵活地减慢、暂停或加速网页中的动画以及其他基于时间变化的元素。这一功能在多个专业场景下...
Read More近日,Bolt Foundry在GitHub上开源了名为Gambit的代理(Agent)框架,旨在解决当前大型语言模型(LLM)工作流开发中普遍存在的痛点。该框架通过引入“牌组”(decks)这一核心概念,将工作流分解为小型、强类型的可组...
Read More