智能体的相关内容 - 漫话开发者

2026-07-27 talkingdev

Claude Opus 5发布：长时运行智能体迎来阶跃式升级，编程与科研性能大幅提升

Anthropic正式发布了新一代AI模型Claude Opus 5，作为Opus系列的重大迭代，该模型被定位为“面向长时间运行智能体的阶跃式改进”。相比前代Opus 4.8，Opus 5在性能与成本效益之间实现了更优平衡，尤其在软件工程和科学...

2026-07-27 talkingdev

提示缓存正在成为构建经济型智能体的关键技术，但其表现十分脆弱。在编码智能体等复杂系统中，一次工具定义的修改、模型版本的切换，或云服务提供商的路由决策变更，都可能将原本低成本的增量请求转变为对上下文的完...

2026-07-27 talkingdev

Baseten 为 GLM-5.2 模型构建的全新 API 在推理速度上取得了突破性进展，峰值速度高达 280 tokens/秒，平均速度约为 100 tokens/秒，整体性能达到发布日初版 API 的两倍以上。这一大幅提升得益于底层的系统级优化与...

2026-07-24 talkingdev

人工智能领军人物吴恩达（Andrew Ng）在GitHub上开源了一个名为OpenWorker的新项目。该项目旨在构建一个运行在本地桌面端的AI同事，它能够理解用户指令，自主跨越不同的文件、文件夹乃至桌面应用程序来执行复杂工作...

2026-07-24 talkingdev

Moonshot AI 最新开源权重模型 Kimi K3 在单次前端竞技场（Frontend Arena）中以 1392 的 Elo 分夺得第一，排名较 Kimi K2.6 上升了 10 位，较 Kimi K2.7 Code 上升了 16 位，创下 Moonshot 模型史上最大跃升记录。...

2026-07-23 talkingdev

OpenAI正式推出Presence，一款面向企业级场景的AI代理部署平台，旨在帮助企业将可信的语音和聊天智能体集成到客户服务与内部工作流中。该平台的核心价值在于，让企业在享受大模型驱动的高价值自动化任务时，仍能保持...

2026-07-22 talkingdev

专攻 AI 编码的初创公司 Poolside 在 Hugging Face 上正式发布了其最新大型语言模型 Laguna S 2.1。该模型采用混合专家架构，总参数量高达 1180 亿，但每个 token 仅激活其中 80 亿个参数，在保持强大能力的同时实现...

2026-07-21 talkingdev

Cursor 团队近期在一项构建 SQLite 的智能体集群实验中取得突破性发现，展示了结构化的多智能体协作在复杂软件工程任务中的巨大潜力。新方案采用规划智能体负责任务分解，再由多个工作智能体并行执行，这种协调机制...