多轮对话的相关内容 - 漫话开发者

2026-06-14 talkingdev

GLM 5.2 正式发布并完全开源：前沿智能属于每一个人

智谱AI（Zhipu AI）联合创始人兼CEO张鹏（jietang）在社交媒体X上正式宣布，GLM系列最新大语言模型GLM 5.2现已完全开源。这一举动在AI社区引发广泛关注。张鹏在声明中强调，当前某些前沿模型突然因非技术原因被限制...

2026-04-30 talkingdev

PyTorch官方博客近日发布了一项名为AutoSP的创新技术，该技术旨在自动化地将标准Transformer训练代码转换为序列并行代码，用于长上下文大语言模型（LLM）的训练。AutoSP已与微软的DeepSpeed框架深度集成，使得开发者...

2026-04-02 talkingdev

人工智能公司Arcee AI近日正式发布了其前沿开源推理模型“Trinity-Large-Thining”。该模型专为处理复杂、长程任务的智能体（Agent）以及多轮工具调用场景而设计，被业界认为是目前中国境外发布的最强大的开源模型之一...

2026-03-04 talkingdev

OpenAI近日发布了其最新对话模型GPT-5.3 Instant，该版本在Hacker News社区引发了广泛关注，获得了319个点赞和254条评论。作为GPT系列的最新迭代，GPT-5.3 Instant的核心升级在于显著提升了日常对话的流畅度和实用性...

2026-02-25 talkingdev

近日，通义千问团队在Hugging Face平台正式发布了Qwen3.5-35B-A3B模型。该模型集成了当前人工智能领域的多项前沿技术突破，旨在通过开源方式推动AI技术的民主化与普及。其核心亮点在于原生支持高达262,144个令牌的上...

2026-01-20 talkingdev

近日，一个名为Gemini Voyager的开源浏览器扩展项目在GitHub上发布，旨在显著提升用户与谷歌Gemini大语言模型交互的体验与效率。该项目并非简单的界面美化工具，而是一个集成了多项高级组织与实用功能的增强套件，直...

2026-01-01 talkingdev

近日，一个名为LMCache的开源项目在GitHub上发布，旨在通过创新的键值（KV）缓存加速层，显著提升大型语言模型（LLM）的服务性能。该项目专为LLM推理服务设计，其核心在于能够跨GPU、CPU、本地磁盘和Redis等多种存储...

2025-12-10 talkingdev

智谱AI近日正式开源了其新一代多模态大模型系列——GLM-4.6V。该系列包含两个关键版本：GLM-4.6V（106B）和GLM-4.6V-Flash（9B）。前者是面向云端和高性能集群场景设计的基础模型，后者则是为本地部署和低延迟应用优化...