大模型的相关内容 - 漫话开发者

2025-12-16 talkingdev

英伟达发布Nemotron 3开源模型家族，以开放生态挑战OpenAI等巨头

英伟达近日正式发布了Nemotron 3系列开源模型，该家族包含Nano（300亿参数，30亿活跃参数）、Super（1000亿参数）和Ultra（5000亿参数）三个版本，其中Super和Ultra型号计划于2026年初推出。尤为引人注目的是，当前...

2025-12-12 talkingdev

人工智能研究机构OpenAI正式发布了其最新的前沿模型GPT-5.2，该模型被定位为专为专业知识工作和长期运行的智能体（agents）而设计的最先进系统。根据官方介绍，GPT-5.2在多个关键领域树立了新的性能标杆，包括代码生...

2025-12-12 talkingdev

OpenAI正式推出其新一代前沿模型GPT-5.2，该模型被定位为专为专业工作场景和长期运行的智能体（agent）工作流而优化的最先进模型。相较于前代，GPT-5.2在多个关键维度实现了显著提升：其一，在知识工作领域，模型展...

2025-12-10 talkingdev

近日，Vercel团队在GitHub上开源了Streamdown项目，这是一个旨在解决AI模型流式输出Markdown内容时特有难题的React库。作为`react-markdown`的直接替代品，Streamdown的核心价值在于其专门针对AI生成内容流式传输过...

2025-12-10 talkingdev

智谱AI近日正式开源了其新一代多模态大模型系列——GLM-4.6V。该系列包含两个关键版本：GLM-4.6V（106B）和GLM-4.6V-Flash（9B）。前者是面向云端和高性能集群场景设计的基础模型，后者则是为本地部署和低延迟应用优化...

2025-12-05 talkingdev

Hugging Face平台近日推出了一项名为“Hugging Face Skills”的新功能，该功能赋予了Anthropic公司的Claude AI模型直接微调开源大语言模型的能力。这项技术突破意味着，用户现在可以通过Claude的对话界面，直接提交模...

2025-12-04 talkingdev

英伟达于近日公布了其最新一代GB200 Blackwell AI服务器的性能基准测试数据，结果显示，相较于前代H100/H200平台，该服务器在运行特定类型的混合专家模型时，性能提升高达10倍。此次测试重点针对中国AI公司月之暗面...

2025-12-03 talkingdev

人工智能领域迎来重要开源进展。Mistral AI正式发布了其新一代Mistral 3系列模型，该系列包含两大技术路线：一是三款不同规模的密集模型（参数规模分别为140亿、80亿和30亿），二是备受瞩目的Mistral Large 3稀疏混...