人工智能研究的相关内容 - 漫话开发者

2026-05-20 talkingdev

AI2发布OlmoEarth v1.1：行星级遥感分析成本骤降3倍，性能不变

艾伦人工智能研究所（Ai2）最新发布的OlmoEarth v1.1模型家族，在遥感智能分析领域实现了显著的成本突破。该系列模型通过创新的序列长度优化技术，将处理遥感数据的计算成本最高降低至原来的三分之一（即3倍效率提升...

2026-04-16 talkingdev

在人工智能领域，众多团队宣称其研发的智能体具备卓越的科学发现能力，但支撑这些声明的证据往往难以令人信服。为客观评估AI在科学探索中的真实水平，艾伦人工智能研究所（AI2）开发并开源了两项关键基准测试：Scien...

2026-04-03 talkingdev

谷歌DeepMind近日正式发布了Gemma 4系列开源模型，标志着其在开放人工智能模型领域迈出了重要一步。该系列模型基于其旗舰Gemma 3技术构建，核心优化方向是“单位参数智能效率”，即在保持模型参数规模相对可控的同时，...

2026-03-24 talkingdev

人工智能研究机构Epoch近日发布报告，确认其最新模型GPT-5.4 Pro成功解决了一个长期悬而未决的前沿数学开放问题——超图上的拉姆齐风格问题。该问题属于组合数学的核心领域，要求构造尽可能大的超图，使其不具备某个易...

2026-03-16 talkingdev

人工智能研究机构Percepta近期发布了一项前沿研究成果，探讨了大型语言模型（LLMs）作为通用计算设备的可能性。该研究成功在Transformer架构内部构建了一个“计算机”，能够高效执行任意的C语言程序，并运行数百万个计...

2026-03-10 talkingdev

随着AI生成代码的广泛应用，新的逻辑缺陷和安全漏洞也随之涌现，给软件开发质量带来了前所未有的挑战。为应对这一行业痛点，人工智能研究公司Anthropic正式推出了Claude Code Review工具。该工具深度集成于其Claude...

2026-03-06 talkingdev

人工智能研究机构OpenAI正式发布了其最新的前沿模型GPT-5.4，该模型被定位为专为专业工作场景设计的、目前能力最强且最高效的版本。GPT-5.4现已通过ChatGPT、API以及Codex平台向用户开放。此次更新的核心在于显著提...

2026-02-11 talkingdev

Meta（原Facebook）旗下研究团队近日在GitHub开源了AIRS-Bench基准测试框架，旨在系统性地量化大型语言模型（LLM）代理在真实世界人工智能研究任务中的端到端能力。该基准包含20个精心设计的机器学习研究任务，每个...