大型语言模型的相关内容 - 漫话开发者

2026-02-23 talkingdev

OpenAI公布First Proof挑战赛提交结果：AI模型尝试攻克十大专家级数学证明难题

OpenAI近日详细公布了其AI模型在全部十道“First Proof”数学研究问题上的端到端证明尝试。First Proof是一项特定领域挑战，旨在测试AI系统能否生成完全可验证的数学论证。OpenAI的博客文章概述了该领域专家对模型提交...

2026-02-23 talkingdev

人工智能安全公司Anthropic近日推出了Claude Code Security的有限研究预览版，标志着AI驱动的代码安全分析领域迈出了重要一步。该系统能够对代码库进行自动化扫描，精准识别依赖于上下文的复杂安全漏洞，并针对性地...

2026-02-21 talkingdev

总部位于印度班加罗尔的AI初创公司Sarvam，于近日正式推出了其名为“Indus”的聊天应用程序Beta版本，该应用面向网页和移动端用户开放。Sarvam的核心战略聚焦于为印度本土语言及用户构建定制化的人工智能模型，此次发...

2026-02-20 talkingdev

人工智能公司GEPA近日推出了一项名为“optimize_anything”的突破性API服务，该服务宣称能够优化任何可表示为文本的“参数”，为人工智能应用开发带来了新的范式。这项技术本质上是一个声明式API，用户只需定义需要优化...

2026-02-16 talkingdev

在GPT-5.x等大型语言模型处理文本之前，所有输入都必须经过一个关键的前置组件——分词器。分词器本质上是一个压缩层，负责将原始文本转换为一系列整数ID序列。近日，一篇深度技术分析文章通过逆向工程OpenAI开源的分...

2026-02-14 talkingdev

近日，一项由OpenAI发布的研究引发了科学界与人工智能领域的广泛关注。根据一份新的预印本论文显示，其最新的大型语言模型GPT-5.2在理论物理学领域取得了一项原创性成果：它独立地提出了一个关于胶子散射振幅的新公...

2026-02-12 talkingdev

近期，一项由人工智能系统独立完成的安全研究引发了科技界广泛关注。该系统在2025年12月至2026年1月期间，在没有人类干预的情况下，自主执行了完整的安全研究流程，成功发现了Node.js和React这两个全球部署最广泛的J...

2026-02-12 talkingdev

OpenAI近期披露了一项引人注目的内部实验成果。在该项目中，一个小型团队成功发布了一款产品，其整个代码库——包括应用逻辑、测试用例、持续集成（CI）流程、技术文档以及相关工具链——均由Codex智能体（agents）自主...