AI系统的相关内容 - 漫话开发者

2026-02-11 talkingdev

开源|AIRS-Bench：Meta发布首个端到端AI研究能力基准，量化大模型代理的科研潜力

Meta（原Facebook）旗下研究团队近日在GitHub开源了AIRS-Bench基准测试框架，旨在系统性地量化大型语言模型（LLM）代理在真实世界人工智能研究任务中的端到端能力。该基准包含20个精心设计的机器学习研究任务，每个...

2026-02-10 talkingdev

开源|ClawSec：为AI智能体打造的全栈安全技能套件在GitHub发布

近日，一个名为ClawSec的综合性安全技能套件在GitHub开源发布，该项目专为OpenClaw系列AI智能体设计，旨在为AI代理的运行环境提供端到端的安全防护。该套件集成了多项前沿安全技术，包括自动化安全审计、实时安全建...

2026-02-07 talkingdev

开源|Monty：专为AI设计的Rust编写轻量安全Python解释器

Pydantic团队近日在GitHub开源了Monty项目，这是一个用Rust语言编写的极简、安全的Python解释器，专为人工智能应用场景设计。该项目在Hacker News技术社区引发广泛关注，获得162个技术点赞和75条深度讨论，显示出业...

2026-01-26 talkingdev

开源|TTT-Discover：推理时强化学习新范式，让大模型实时自适应任务

近日，一个名为TTT-Discover的开源项目在GitHub上发布，其核心创新在于将强化学习（Reinforcement Learning）技术应用于大型语言模型（LLMs）的推理（Inference）阶段，而非传统的训练阶段。这一“测试时训练”（Test-...

2026-01-24 talkingdev

深度解析：OpenAI揭秘Codex智能体循环机制，AI自主决策能力再进一步

OpenAI技术团队成员Michael Bolin近期发表了一篇题为《Unrolling the Codex agent loop》的技术文章，深入剖析了基于Codex模型的智能体（Agent）在执行复杂任务时的内部循环机制。该文章揭示了AI智能体如何通过“感知...

2026-01-15 talkingdev

开源|Vercel推出JSON Render：为AI生成UI加上“安全护栏”，让提示词直接构建可预测界面

Vercel实验室近日在GitHub上开源了名为“JSON Render”的创新库，旨在解决AI生成用户界面（UI）时的安全性与可控性难题。该库的核心思路是“AI → JSON → UI”，即让大型语言模型等AI系统根据自然语言提示（prompts）生成...

2026-01-06 talkingdev

英伟达发布开源AI模型家族Alpamayo，加速基于推理的自动驾驶开发

英伟达今日正式发布了名为Alpamayo的开源AI模型家族，并配套推出了仿真工具与数据集，旨在加速下一代基于推理的安全型自动驾驶系统的开发进程。这一系列模型、数据集和仿真器主要针对自动驾驶领域中的“长尾挑战”——即...

2026-01-05 talkingdev

开源|HGMem：超图工作记忆框架提升LLM复杂关系推理能力

近日，一个名为HGMem的开源项目在GitHub上发布，该项目实现了一篇题为《Improving Multi-step RAG with Hypergraph-based Memory for Long-context Complex Relational Modeling》的论文。HGMem是一个基于超图的工作...