语言模型的相关内容 - 漫话开发者

2025-12-23 talkingdev

智谱AI发布GLM-4.7：新一代开源编码模型刷新SOTA，推理与多模态能力全面升级

近日，智谱AI正式发布了其通用语言模型系列的最新力作——GLM-4.7。作为一款高端基础模型，GLM-4.7的核心定位在于处理复杂的推理任务、专业级代码生成以及多模态工作负载。相较于前代版本，此次更新在多个维度实现了显...

2025-12-23 talkingdev

据《金融时报》援引知情人士消息，TikTok母公司字节跳动已制定初步计划，将在人工智能领域进行大规模资本支出。根据该计划，字节跳动2026年用于AI的资本支出（capex）预计将达到约1600亿元人民币（约合230亿美元），...

2025-12-22 talkingdev

近日，GitHub Gist上出现了一项名为“Claude's frontend design skill”的AI技能，标志着生成式AI在专业前端开发领域的应用迈出了重要一步。该技能的核心目标在于解决当前AI生成界面普遍存在的“通用化美学”问题，即缺...

2025-12-22 talkingdev

人工智能领域知名专家安德烈·卡帕西（Andrej Karpathy）近期发布了其对2025年大语言模型（LLM）发展的年度回顾，系统性地梳理了行业在过去一年中经历的深刻范式转变。报告指出，技术演进的核心驱动力已从单纯追求模...

2025-12-22 talkingdev

当AI智能体协助用户处理横跨数百条消息的复杂任务时，一旦其上下文窗口耗尽，是能够继续高效工作，还是被迫从头开始？这直接决定了智能体的实用性与可靠性。Factory.ai的最新研究深入探讨了这一问题，并提出了一套评...

2025-12-21 talkingdev

人工智能模型评估机构METR发布的最新数据显示，Anthropic公司推出的Claude Opus 4.5大型语言模型在任务处理时效性上取得了显著突破。根据METR的评估框架，Claude Opus 4.5的“50%任务完成时间视界”约为4小时49分钟，...

2025-12-20 talkingdev

在AI驱动编程工具竞争日益激烈的背景下，一项重要的行业整合事件引发了开发者社区的广泛关注。专注于代码审查与协作的初创公司Graphite近日正式宣布，将加入由知名AI代码助手Cursor构建的生态系统。Cursor凭借其深度...

2025-12-20 talkingdev

知名AI研究员Andrej Karpathy近期发布了其对2025年大语言模型（LLM）领域范式变革的年度回顾文章，引发了技术社区的广泛关注与讨论。该文章深度剖析了过去一年中LLM领域在架构、训练范式、应用部署及多模态融合等方...