OpenAI近日发布了一份工程指南,详细介绍了如何使用其最新优化的模型gpt-realtime-translate构建实时语音翻译系统。该模型专为同声传译场景设计,与传统的轮次语音交互不同,它能实现对语音流进行实时、连续的翻译处...
Read More谷歌DeepMind近日正式发布了Gemma 4系列开源模型,标志着其在开放人工智能模型领域迈出了重要一步。该系列模型基于其旗舰Gemma 3技术构建,核心优化方向是“单位参数智能效率”,即在保持模型参数规模相对可控的同时,...
Read More微软近日在GitHub上开源了Agent Package Manager(APM),这是一个专为AI智能体设计的开源、社区驱动的依赖管理器。该工具旨在解决AI智能体开发中环境配置复杂、依赖项管理繁琐的痛点。开发者只需在一个YML文件中声...
Read More构建AI智能体的真正难点,并非仅仅是让大语言模型(LLM)给出回应,而是确保其在生产环境中,基于企业自身数据,能够持续、稳定、准确地响应。这本质上是一个复杂的检索增强生成(RAG)问题。Algolia,这家每年处理...
Read MoreOpenAI近日披露了其内部研发的专用AI数据智能体,该智能体深度融合了GPT-5、Codex以及记忆机制等前沿技术,能够在其内部平台的海量数据集上进行探索与推理。这一工具旨在赋能员工,使其能够在数分钟内完成从提出问题...
Read More近日,备受开发者关注的本地大语言模型运行平台LM Studio发布了其0.4.0版本更新。本次更新带来了多项关键性功能升级,核心聚焦于提升生产环境下的部署能力与推理性能。最引人注目的新特性是支持服务器部署模式,这使...
Read More近日,开发者jmuncor在GitHub上开源了一个名为Sherlock的工具,它是一个专门用于拦截和可视化大型语言模型API流量的中间人代理。该工具源于开发者对Claude Code等AI开发工具实际API通信内容的好奇心。Sherlock部署在...
Read More近日,月之暗面(Moonshot AI)在GitHub上正式开源了Kimi Agent SDK,为开发者提供了与Kimi CLI进行程序化交互的官方接口。该SDK是一套多语言库,旨在将Kimi Code智能体运行时能力暴露给应用程序,使开发者能够基于...
Read More