多模态大模型的相关内容 - 漫话开发者

2026-07-17 talkingdev

Moonshot 发布 Kimi K3：2.8万亿参数多模态巨擘，百万Token上下文与代理编码能力全开

国内人工智能公司 Moonshot 正式推出新一代旗舰多模态模型 Kimi K3，参数规模高达 2.8 万亿，并原生支持 100 万 token 的超长上下文窗口。K3 的亮点不仅在于规模，更在于工程上的深度优化：团队针对长上下文场景大幅...

2026-05-19 talkingdev

阿里巴巴通义千问团队近日在Arena平台上发布了Qwen3.7预览版，涵盖文本和视觉两大核心能力。据悉，Qwen3.7 Max Preview在文本竞技场中位列第13名，而Qwen3.7 Plus Preview则在视觉竞技场中排名第16，显示出阿里在大...

2026-05-08 talkingdev

OpenAI近日在API中正式推出了一系列全新的实时音频模型，标志着语音交互技术迈入了一个全新阶段。该系列包括三款核心模型：GPT-Realtime-2，专注于增强对话式推理能力，能够实现更自然、更具逻辑性的实时语音对话；G...

2026-04-20 talkingdev

Anthropic Labs今日正式发布Claude Design，标志着生成式AI在专业视觉创作领域迈出关键一步。该产品基于Claude Opus 4.7多模态视觉模型构建，能够协助用户高效生成设计原型、商业演示文稿、营销单页等视觉内容。其核...

2026-03-19 talkingdev

百度近期在GitHub上开源了其企业级视觉语言模型系列——千帆VL（Qianfan-VL）。该系列模型并非通用型多模态模型的简单变体，而是针对工业场景进行了深度优化和增强的专用模型。其核心设计目标是解决企业级应用中的实际...

2025-12-10 talkingdev

智谱AI近日正式开源了其新一代多模态大模型系列——GLM-4.6V。该系列包含两个关键版本：GLM-4.6V（106B）和GLM-4.6V-Flash（9B）。前者是面向云端和高性能集群场景设计的基础模型，后者则是为本地部署和低延迟应用优化...

2025-11-10 talkingdev

根据麦肯锡最新发布的AI年度报告，当前大多数企业仍处于人工智能技术的实验性探索或试点应用阶段。值得注意的是，行业领先企业正通过AI技术实现三重突破：驱动业务增长引擎、构建创新产品生态、优化运营成本结构。报...

2025-10-17 talkingdev

近日，开发者通过Google AI Studio的A/B测试功能，意外捕捉到尚未正式发布的Gemini 3.0模型踪迹。该测试以SVG矢量图形生成作为核心评估标准，通过对比不同版本模型的输出质量，间接验证了新一代模型在复杂结构化数据...