基础模型的相关内容 - 漫话开发者

2026-03-31 talkingdev

开源|谷歌发布TimesFM时间序列基础模型，革新时序预测范式

谷歌研究团队近日在GitHub上开源了TimesFM（Time Series Foundation Model），这是一个预训练的时间序列基础模型，专为时间序列预测任务而设计。该模型采用了一种创新的“分块解码器”风格注意力架构，并在一个大规模...

2026-03-18 talkingdev

法国人工智能公司Mistral AI正式推出了名为“Forge”的全新平台，旨在为企业和政府机构提供构建定制化AI模型的解决方案。该平台的核心特点是允许客户完全基于自身的专有数据，从头开始训练前沿级别的AI模型，而非仅仅...

2026-03-17 talkingdev

在GTC 2026技术大会的预告中，NVIDIA勾勒了一幅宏大的AI技术发展蓝图，宣布将全面扩展其人工智能技术栈。该计划的核心在于构建一个跨越多个关键领域的综合性AI生态系统。具体而言，NVIDIA将深化与各方的合作，共同推...

2026-02-27 talkingdev

近日，由Saksham和Ishan共同创立的YC W26项目Cardboard正式亮相，这是一款革命性的AI视频编辑工具。用户只需用自然语言描述需求，如“从这段原始素材中制作一个60秒的回顾”或“将其剪成20秒的广告”，Cardboard便能自动...

2026-02-25 talkingdev

近日，通义千问团队在Hugging Face平台正式发布了Qwen3.5-35B-A3B模型。该模型集成了当前人工智能领域的多项前沿技术突破，旨在通过开源方式推动AI技术的民主化与普及。其核心亮点在于原生支持高达262,144个令牌的上...

2026-02-20 talkingdev

近日，StepFun正式发布了其前沿开源基础模型Step 3.5 Flash。该模型定位为高效、高速推理与具备智能体（Agent）能力的先进模型，其核心特性在于集成了工具使用、长上下文处理以及支持本地部署等关键能力。Step 3.5 F...

2026-02-18 talkingdev

Cohere的研究部门Cohere Labs近日正式发布了Tiny Aya系列开源模型，这是目前在其参数量级上性能最强的多语言开源模型。该系列包括基础模型TinyAya-Base（35亿参数）以及经过指令微调的TinyAya-Global和多个区域变体...

2026-02-12 talkingdev

智谱AI正式发布了其新一代开源大模型GLM-5，该模型以MIT许可证开源，参数量达到惊人的7540亿，是前代GLM-4.7（3680亿参数）规模的两倍以上。在技术性能上，GLM-5在广泛的学术基准测试中相比GLM-4.7实现了显著提升，...