Qwen的相关内容 - 漫话开发者

2025-08-15 talkingdev

Baseten推出高性能开源大模型API服务，支持Kimi K2、GPT-OSS等前沿模型

Baseten近日推出其Model APIs服务，旨在为开发者提供高性能的开源大语言模型部署解决方案。该服务支持包括Kimi K2、GPT-OSS、DeepSeek、Qwen 3等在内的多款前沿开源模型，承诺提供行业领先的性能表现和极具竞争力的...

2025-08-11 talkingdev

近日，一篇深度分析文章《From GPT-2 to GPT-OSS: Analyzing the Architectural Advances》引发技术社区广泛讨论。文章系统梳理了从GPT-2到最新GPT-OSS（开源GPT模型）的架构演进历程，重点对比了其与阿里云Qwen3的...

2025-08-05 talkingdev

Qwen-Image作为一款200亿参数的MMDiT架构图像基础模型，在复杂文本渲染和精准图像生成领域取得重大突破。该模型不仅能实现多语言（包括字母文字和表意文字）的多行文本布局和段落级语义生成，还能保持编辑过程中的语...

2025-07-28 talkingdev

阿里巴巴最新开源的Qwen3-235B思维模型在技术领域取得重大突破，该模型在AIME25数学竞赛中达到92.3%的准确率，与OpenAI的O4-mini性能相当，并在编码基准测试中以74.1%的LiveCodeBench得分实现超越。这一2350亿参数的...

2025-07-25 talkingdev

Qwen-MT最新版本（qwen-mt-turbo）基于强大的Qwen3模型进行了重大升级，在翻译准确性和语言流畅度方面取得了显著提升。该模型通过利用数万亿的多语言和翻译标记，全面增强了其多语言理解和翻译能力。Qwen-MT的关键特...

2025-07-23 talkingdev

通义千问团队正式发布Qwen3-Coder，这是迄今为止最先进的智能编码代理模型。该模型采用4800亿参数的混合专家架构（Mixture-of-Experts），其中激活参数达350亿，并支持超长上下文处理。在智能编码、浏览器操作和工具...

2025-07-22 talkingdev

阿里云旗下通义千问(Qwen)团队近日宣布对Qwen3-235B-A22B模型进行重大更新，新版本编号为Qwen3-235B-A22B-2507。此次更新的核心变化是取消了原先的混合思维模式(hybrid thinking mode)，转而采用将指令模型(Instruct...

2025-07-11 talkingdev

开发者Henry和Roman近日推出开源项目Cactus，这是一个专为智能手机设计的跨平台框架，支持本地部署大型语言模型（LLM）、视觉语言模型（VLM）和文本转语音（TTS）模型。与Ollama专注于笔记本和边缘服务器不同，Cactu...