人工智能开源项目的相关内容 - 漫话开发者

2026-01-14 talkingdev

开源|CaRR：为深度搜索智能体引入引文感知的规则奖励，提升强化学习鲁棒性

清华大学知识工程实验室（THUDM）在GitHub开源了项目CaRR，其对应论文《Chaining the Evidence: Robust Reinforcement Learning for Deep Search Agents with Citation-Aware Rubric Rewards》提出了一种创新方法，...