语言模型的相关内容 - 漫话开发者

2026-02-16 talkingdev

逆向工程GPT-5分词器：20万Token揭示AEO/GEO策略与性能影响

在GPT-5.x等大型语言模型处理文本之前，所有输入都必须经过一个关键的前置组件——分词器。分词器本质上是一个压缩层，负责将原始文本转换为一系列整数ID序列。近日，一篇深度技术分析文章通过逆向工程OpenAI开源的分...

2026-02-14 talkingdev

近日，一项由OpenAI发布的研究引发了科学界与人工智能领域的广泛关注。根据一份新的预印本论文显示，其最新的大型语言模型GPT-5.2在理论物理学领域取得了一项原创性成果：它独立地提出了一个关于胶子散射振幅的新公...

2026-02-13 talkingdev

近日，多家领先的AI推理服务提供商，包括Baseten、DeepInfra、Fireworks AI和Together AI，宣布通过在其服务中部署基于NVIDIA Blackwell架构的GPU并运行开源模型，成功将每次推理的令牌成本大幅降低了高达10倍。这一...

2026-02-12 talkingdev

近期，一项由人工智能系统独立完成的安全研究引发了科技界广泛关注。该系统在2025年12月至2026年1月期间，在没有人类干预的情况下，自主执行了完整的安全研究流程，成功发现了Node.js和React这两个全球部署最广泛的J...

2026-02-12 talkingdev

OpenAI近期披露了一项引人注目的内部实验成果。在该项目中，一个小型团队成功发布了一款产品，其整个代码库——包括应用逻辑、测试用例、持续集成（CI）流程、技术文档以及相关工具链——均由Codex智能体（agents）自主...

2026-02-12 talkingdev

智谱AI正式发布了其新一代开源大模型GLM-5，该模型以MIT许可证开源，参数量达到惊人的7540亿，是前代GLM-4.7（3680亿参数）规模的两倍以上。在技术性能上，GLM-5在广泛的学术基准测试中相比GLM-4.7实现了显著提升，...

2026-02-11 talkingdev

Tambo AI 近日在 GitHub 上开源了一个名为 Tambo 的 React 工具包，旨在为开发者提供构建能够生成并与动态用户界面交互的 AI 智能体（Agent）的能力。该工具包的核心创新在于，它允许开发者使用 Zod 模式（Schema）...

2026-02-11 talkingdev

Meta（原Facebook）旗下研究团队近日在GitHub开源了AIRS-Bench基准测试框架，旨在系统性地量化大型语言模型（LLM）代理在真实世界人工智能研究任务中的端到端能力。该基准包含20个精心设计的机器学习研究任务，每个...