上下文的相关内容 - 漫话开发者

2025-12-10 talkingdev

开源|智谱AI发布GLM-4.6V系列多模态大模型：原生工具调用与128K上下文窗口

智谱AI近日正式开源了其新一代多模态大模型系列——GLM-4.6V。该系列包含两个关键版本：GLM-4.6V（106B）和GLM-4.6V-Flash（9B）。前者是面向云端和高性能集群场景设计的基础模型，后者则是为本地部署和低延迟应用优化...

2025-12-05 talkingdev

人工智能智能体（AI Agent）的开发格局正在快速演变。当前，越来越多的组织正致力于部署复杂、自主的智能体来处理需要长期规划和多步骤执行的“长视野任务”。然而，这一雄心正面临一个关键瓶颈：上下文（Context）的...

2025-12-05 talkingdev

检索增强生成（RAG）在理论上看似简单：检索相关文档，将其输入大语言模型，获得有据可依的答案。然而，在实践中，系统的成败取决于数十个关键决策。Algolia发布的白皮书全面剖析了构建高效RAG系统的完整技术管线。...

2025-12-04 talkingdev

英伟达于近日公布了其最新一代GB200 Blackwell AI服务器的性能基准测试数据，结果显示，相较于前代H100/H200平台，该服务器在运行特定类型的混合专家模型时，性能提升高达10倍。此次测试重点针对中国AI公司月之暗面...

2025-12-01 talkingdev

在AI辅助编程日益普及的今天，如何高效地将大型语言模型（如Claude）集成到软件开发流程中，已成为提升工程师生产力的关键。`CLAUDE.md`文件正是这一趋势下的重要配置工具，它充当了AI代理（Agent）进入代码库的“入...

2025-12-01 talkingdev

随着AI智能体在软件开发领域的深入应用，如何有效配置和引导这些智能体成为开发者关注的核心技能。近期，一篇关于撰写高质量`CLAUDE.md`文件的文章在技术社区引发广泛讨论，获得了424个点赞和134条评论，凸显了行业...

2025-11-27 talkingdev

谷歌Gemini模型近日通过开源项目Gemini CLI正式登陆终端环境，这一进展标志着AI助手在开发者工作流中的深度集成迈入新阶段。该项目由谷歌工程总监Addy Osmani主导，系统性地发布了30个专业级使用技巧，涵盖持久化上...

2025-11-26 talkingdev

近日，TEN框架在GitHub平台正式开源，这是一个专门为对话式语音AI智能体设计的开源开发框架。该框架的发布标志着语音交互AI领域迎来了重要的技术突破，为开发者提供了构建复杂语音对话系统的标准化工具集。TEN框架支...