大语言模型的相关内容 - 漫话开发者

2026-01-01 talkingdev

2025年大语言模型回顾：推理能力突破、AI智能体普及与格局重塑

根据年度回顾分析，2025年是大语言模型（LLM）发展史上具有里程碑意义的一年。核心技术突破体现在模型获得了真正的“推理”能力，使其能够处理复杂的多步骤任务，这直接推动了高性能AI智能体的广泛应用。其中，“编码智...

2025-12-31 talkingdev

据《南华早报》记者Wency Chen援引知情人士消息，中国科技巨头字节跳动计划在2026年投入约140亿美元用于采购英伟达的人工智能芯片，这一预算较2025年预计支出增长约18%，折合人民币约1000亿元。这一巨额投资计划直接...

2025-12-25 talkingdev

据CNBC独家报道，全球人工智能芯片巨头英伟达（Nvidia）正在进行其有史以来规模最大的一笔收购，将以约200亿美元的现金，收购成立九年的AI芯片初创公司Groq的资产。这笔交易不仅刷新了英伟达自身的收购纪录，也成为...

2025-12-23 talkingdev

人工智能开源领域迎来重要进展。知名开源力量MiniMax推出的最新模型M2.1现已正式在Kilo平台上线。根据官方信息，M2.1在多项关键基准测试中表现优异，其性能已超越国内同行DeepSeek和Kimi等知名模型。更值得关注的是...

2025-12-23 talkingdev

近日，智谱AI正式发布了其通用语言模型系列的最新力作——GLM-4.7。作为一款高端基础模型，GLM-4.7的核心定位在于处理复杂的推理任务、专业级代码生成以及多模态工作负载。相较于前代版本，此次更新在多个维度实现了显...

2025-12-23 talkingdev

据《金融时报》援引知情人士消息，TikTok母公司字节跳动已制定初步计划，将在人工智能领域进行大规模资本支出。根据该计划，字节跳动2026年用于AI的资本支出（capex）预计将达到约1600亿元人民币（约合230亿美元），...

2025-12-22 talkingdev

人工智能领域知名专家安德烈·卡帕西（Andrej Karpathy）近期发布了其对2025年大语言模型（LLM）发展的年度回顾，系统性地梳理了行业在过去一年中经历的深刻范式转变。报告指出，技术演进的核心驱动力已从单纯追求模...

2025-12-22 talkingdev

当AI智能体协助用户处理横跨数百条消息的复杂任务时，一旦其上下文窗口耗尽，是能够继续高效工作，还是被迫从头开始？这直接决定了智能体的实用性与可靠性。Factory.ai的最新研究深入探讨了这一问题，并提出了一套评...