学习的相关内容 - 漫话开发者

2026-01-14 talkingdev

开源|CaRR：为深度搜索智能体引入引文感知的规则奖励，提升强化学习鲁棒性

清华大学知识工程实验室（THUDM）在GitHub开源了项目CaRR，其对应论文《Chaining the Evidence: Robust Reinforcement Learning for Deep Search Agents with Citation-Aware Rubric Rewards》提出了一种创新方法，...

2026-01-11 talkingdev

开源|Open Chaos：一个自我演化的开源项目

近日，一个名为Open Chaos的开源项目在技术社区引发了广泛关注。该项目定位为一个“自我演化”的开源项目，其核心理念在于构建一个能够根据社区贡献、用户反馈和环境变化而自主适应、持续进化的软件系统。这标志着开源...

2026-01-10 talkingdev

轻量标记语言Markdown如何悄然征服世界：从技术工具到文化现象的演进

一篇由知名科技博主Anil Dash撰写的深度文章，揭示了轻量级标记语言Markdown如何从一项简单的技术工具演变为全球性的文化现象。文章指出，Markdown由John Gruber于2004年创建，其设计初衷是让普通用户能够使用易读易...

2026-01-08 talkingdev

论文推荐|WebGym：为视觉网页智能体构建近30万真实任务的大规模训练场，性能超越GPT-4o

近日，研究人员推出了迄今为止最大规模的开源环境WebGym，专门用于训练能够处理真实世界网页任务的视觉智能体。该环境的核心价值在于解决了现有训练集的局限性：人工合成或小规模任务集无法应对真实网站的多样性和非...

2026-01-08 talkingdev

开源|NitroGen：基于互联网游戏视频训练的通用游戏智能体基础模型发布

近日，由MineDojo团队在GitHub上开源的项目NitroGen引起了人工智能与游戏交叉领域的广泛关注。该项目提出了一个旨在成为“通用游戏智能体”的基础模型。其核心创新在于，模型并非针对单一游戏进行专门训练，而是通过大...

2026-01-01 talkingdev

开源|Ensue Memory Network：为LLM构建持久化知识树，终结对话“重置”难题

近日，GitHub上开源项目Ensue Memory Network引发人工智能领域开发者关注。该项目旨在为大型语言模型（LLM）提供一个持久化且可不断生长的“知识树”系统，从根本上解决当前LLM在每次新对话中“重置”上下文、无法积累长...

2026-01-01 talkingdev

开源|哈佛大学CS249R课程开源教材发布，聚焦深度学习与强化学习实战

哈佛大学前沿计算领域近期迎来一项重要开源成果——该校CS249R课程《机器学习系统导论》的官方教材已在GitHub平台全面公开。这本由哈佛大学边缘计算研究小组维护的教材，系统性地涵盖了深度学习与强化学习的核心原理，...

2026-01-01 talkingdev

开源|E2E：基于JAX的端到端测试时训练框架，革新长上下文语言建模

近日，GitHub上开源了一个名为E2E的JAX官方实现项目，它提出了一种创新的长上下文语言建模方法。该方法的核心在于将传统的语言建模任务重新定义为持续学习问题。E2E模型采用标准的Transformer架构，并配合滑动窗口注...