开源模型的相关内容 - 漫话开发者

2025-12-23 talkingdev

开源模型新突破：MiniMax M2.1正式登陆Kilo平台，多项基准测试超越DeepSeek与Kimi

人工智能开源领域迎来重要进展。知名开源力量MiniMax推出的最新模型M2.1现已正式在Kilo平台上线。根据官方信息，M2.1在多项关键基准测试中表现优异，其性能已超越国内同行DeepSeek和Kimi等知名模型。更值得关注的是...

2025-12-22 talkingdev

人工智能领域知名专家安德烈·卡帕西（Andrej Karpathy）近期发布了其对2025年大语言模型（LLM）发展的年度回顾，系统性地梳理了行业在过去一年中经历的深刻范式转变。报告指出，技术演进的核心驱动力已从单纯追求模...

2025-12-20 talkingdev

知名AI研究员Andrej Karpathy近期发布了其对2025年大语言模型（LLM）领域范式变革的年度回顾文章，引发了技术社区的广泛关注与讨论。该文章深度剖析了过去一年中LLM领域在架构、训练范式、应用部署及多模态融合等方...

2025-12-16 talkingdev

英伟达近日正式发布了Nemotron 3系列开源模型，该家族包含Nano（300亿参数，30亿活跃参数）、Super（1000亿参数）和Ultra（5000亿参数）三个版本，其中Super和Ultra型号计划于2026年初推出。尤为引人注目的是，当前...

2025-12-10 talkingdev

人工智能领域的重要参与者Mistral AI近日正式发布了其新一代开源代码智能体模型Devstral 2与Devstral Small 2，并同步推出了端到端代码自动化命令行工具Mistral Vibe CLI。这一组合标志着开源代码智能体技术迈入了一...

2025-12-10 talkingdev

智谱AI近日正式开源了其新一代多模态大模型系列——GLM-4.6V。该系列包含两个关键版本：GLM-4.6V（106B）和GLM-4.6V-Flash（9B）。前者是面向云端和高性能集群场景设计的基础模型，后者则是为本地部署和低延迟应用优化...

2025-12-06 talkingdev

根据AI模型聚合平台OpenRouter发布的最新年度研究报告，通过对过去一年内超过100万亿个令牌（tokens）的实证分析，揭示了当前AI模型使用格局的重大转变。报告指出，以Claude 3.5 Sonnet、GPT-4o和o1系列为代表的“推...

2025-12-03 talkingdev

人工智能研究公司Perplexity近日开源了其最新研究成果“BrowseSafe”，这是一个专门为保护AI浏览器智能体（AI Browser Agents）而设计的实时内容检测模型与基准测试套件。在开放世界的网页环境中，AI智能体在执行网页...