漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-10-02 talkingdev

Thinking Machines实验室推出Tinker API:革新语言模型微调技术

Thinking Machines实验室近日正式发布Tinker API,这一创新平台为开源权重语言模型的精细化调优提供了灵活接口。该技术通过抽象化底层基础设施复杂度,显著降低了开发者部署大型语言模型的技术门槛。特别值得关注的...

Read More
2025-09-23 talkingdev

阿里发布通义千问Qwen3-Omni:开源多模态AI模型可处理文本、音频、图像及视频输入并生成文本与语音输出

阿里巴巴正式推出通义千问Qwen3-Omni系列开源人工智能模型,该模型实现了对文本、音频、图像和视频四类模态数据的统一处理能力,并能同步生成文本与语音输出。作为中国科技企业对抗美国科技巨头的重要技术突破,Qwen...

Read More
2025-08-18 talkingdev

Qwen3-Embedding-0.6B模型实现百万级文本高效嵌入,GPU利用率近100%

近日,Qwen3-Embedding-0.6B模型在文本嵌入领域取得重大突破,能够高效处理百万级文本数据,并实现接近100%的GPU利用率。该技术流程包括从S3读取文档、使用spaCy进行句子分块、利用Qwen3生成嵌入向量,并将结果写入t...

Read More
2025-08-15 talkingdev

Baseten推出高性能开源大模型API服务,支持Kimi K2、GPT-OSS等前沿模型

Baseten近日推出其Model APIs服务,旨在为开发者提供高性能的开源大语言模型部署解决方案。该服务支持包括Kimi K2、GPT-OSS、DeepSeek、Qwen 3等在内的多款前沿开源模型,承诺提供行业领先的性能表现和极具竞争力的...

Read More
2025-08-11 talkingdev

从GPT-2到GPT-OSS:架构演进全解析与Qwen3的对比

近日,一篇深度分析文章《From GPT-2 to GPT-OSS: Analyzing the Architectural Advances》引发技术社区广泛讨论。文章系统梳理了从GPT-2到最新GPT-OSS(开源GPT模型)的架构演进历程,重点对比了其与阿里云Qwen3的...

Read More
2025-08-05 talkingdev

开源|Qwen-Image:突破性图像基础模型实现原生文本渲染

Qwen-Image作为一款200亿参数的MMDiT架构图像基础模型,在复杂文本渲染和精准图像生成领域取得重大突破。该模型不仅能实现多语言(包括字母文字和表意文字)的多行文本布局和段落级语义生成,还能保持编辑过程中的语...

Read More
2025-07-28 talkingdev

阿里开源Qwen3-235B思维模型:数学竞赛92.3%准确率,推理效率超越传统密集模型

阿里巴巴最新开源的Qwen3-235B思维模型在技术领域取得重大突破,该模型在AIME25数学竞赛中达到92.3%的准确率,与OpenAI的O4-mini性能相当,并在编码基准测试中以74.1%的LiveCodeBench得分实现超越。这一2350亿参数的...

Read More
2025-07-25 talkingdev

[开源]Qwen-MT:速度与智能并行的新一代翻译模型

Qwen-MT最新版本(qwen-mt-turbo)基于强大的Qwen3模型进行了重大升级,在翻译准确性和语言流畅度方面取得了显著提升。该模型通过利用数万亿的多语言和翻译标记,全面增强了其多语言理解和翻译能力。Qwen-MT的关键特...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page