Meta(原Facebook)旗下研究团队近日在GitHub开源了AIRS-Bench基准测试框架,旨在系统性地量化大型语言模型(LLM)代理在真实世界人工智能研究任务中的端到端能力。该基准包含20个精心设计的机器学习研究任务,每个...
Read More近日,一个名为ClawSec的综合性安全技能套件在GitHub开源发布,该项目专为OpenClaw系列AI智能体设计,旨在为AI代理的运行环境提供端到端的安全防护。该套件集成了多项前沿安全技术,包括自动化安全审计、实时安全建...
Read More近日,一款名为ReMemory的开源工具在技术社区引发关注。该工具旨在解决因意外(如脑震荡导致失忆)而无法访问个人加密数据的现实风险。开发者结合了Shamir秘密共享方案(采用HashiCorp Vault的实现)与age-encryptio...
Read MorePydantic团队近日在GitHub开源了Monty项目,这是一个用Rust语言编写的极简、安全的Python解释器,专为人工智能应用场景设计。该项目在Hacker News技术社区引发广泛关注,获得162个技术点赞和75条深度讨论,显示出业...
Read More近日,国内人工智能公司月之暗面(Moonshot AI)在GitHub上正式发布了其号称“最强大模型”的Kimi K2.5的技术报告。这份技术报告的公开,迅速吸引了全球开发者与AI研究者的高度关注,在知名技术社区Hacker News上获得...
Read More近日,GitHub开源项目SWE-Pruner提出了一种名为‘任务感知上下文剪枝’的创新框架,旨在显著优化代码智能体(Coding Agents)在处理复杂软件工程任务时的效率与成本。该框架的核心在于,通过一个轻量级模型动态分析与...
Read MoreMeta AI研究院近日在GitHub开源了ShapeR项目,该项目代表了3D场景重建领域的一项重要进展。ShapeR的核心技术在于能够仅从一系列图像中,重建出完整的、高质量的三维场景网格。其技术路径颇具创新性:首先,系统从输...
Read More清华大学知识工程实验室(THUDM)在GitHub开源了项目CaRR,其对应论文《Chaining the Evidence: Robust Reinforcement Learning for Deep Search Agents with Citation-Aware Rubric Rewards》提出了一种创新方法,...
Read More