AI研究的相关内容 - 漫话开发者

2026-06-23 talkingdev

AI模型规模狂飙：到2031年参数量将达1.4千万亿？核心约束竟是内存速度

一篇来自LessWrong社区的技术文章深入探讨了2023年至2031年间大型语言模型（LLM）规模扩展的物理极限。文章指出，虽然预训练算力是决定模型规模的关键，但一个常被忽视的硬性约束在于推理时的令牌生成速度。具体来说...

2026-06-20 talkingdev

AlphaFold的核心领导者John Jumper在X平台宣布，在Google DeepMind工作近9年后，他将离职并加入人工智能公司Anthropic。Jumper表示，在完成博士学位仅6个月后，Demis Hassabis便大胆任命他领导AlphaFold团队，他对这...

2026-06-19 talkingdev

随着AI智能体在多个行业的渗透率持续攀升，其潜在经济价值正引起广泛关注。据预测，到2030年，仅在美国，AI智能体就能创造高达2.9万亿美元的经济价值。然而，随着模型能力越来越强，传统的对齐技术（Alignment）已难...

2026-06-14 talkingdev

智谱AI（Zhipu AI）联合创始人兼CEO张鹏（jietang）在社交媒体X上正式宣布，GLM系列最新大语言模型GLM 5.2现已完全开源。这一举动在AI社区引发广泛关注。张鹏在声明中强调，当前某些前沿模型突然因非技术原因被限制...

2026-06-09 talkingdev

OpenAI首席执行官Sam Altman与研究负责人Jakub Pachocki联合发布了一项新的战略规划，明确提出公司已进入发展的“第三阶段”。该规划的核心目标包括：构建自动化的AI研究员、在加速经济增长的同时确保收益广泛共享，以...

2026-04-30 talkingdev

随着人工智能大模型规模的不断增长，模型评估（Eval）环节正在迅速演变为一个新的计算瓶颈，其成本在某些情况下甚至已经逼近甚至超过了模型训练的开销。根据最新的行业分析，一次全面的AI评估运行费用可能高达数万美...

2026-04-25 talkingdev

一篇发表于arXiv上的新论文《There Will Be a Scientific Theory of Deep Learning》正引发人工智能学术界的广泛讨论。该文阐述了深度学习虽在实践中取得空前成功，但其理论基础仍相对薄弱，核心机制尚未被完全揭示...

2026-04-16 talkingdev

在人工智能领域，众多团队宣称其研发的智能体具备卓越的科学发现能力，但支撑这些声明的证据往往难以令人信服。为客观评估AI在科学探索中的真实水平，艾伦人工智能研究所（AI2）开发并开源了两项关键基准测试：Scien...