在大型语言模型领域,一种新的视角正在引发讨论:将上下文视为“软件”,而将权重视为“硬件”。这种比喻揭示了模型运作的本质差异。上下文(如KV缓存)动态地调节模型的激活值,为特定任务提供临时性的“编程”,从而实现...
Read More近日,一个名为Letta Code的开源项目在GitHub上发布,它代表了一种新型AI编程代理的设计范式。该项目旨在构建一个“记忆优先”的编程框架,专为能够跨会话持久存在的长期智能体而设计。与传统的、每次对话都从零开始的...
Read More近日,一个名为Hippo Memory的开源项目在GitHub上发布,旨在为AI智能体构建一个受生物学启发的记忆系统,以解决其在长期交互中遗忘关键上下文信息的核心难题。该项目灵感来源于人类大脑中的海马体,通过模拟记忆衰减...
Read More近日,一项名为“LLM Wiki”的创新框架在开发者社区引发关注。该框架的核心是一个可被复制并粘贴到大语言模型(LLM)智能体中的“想法文件”,旨在为利用LLM构建和维护知识库提供一套系统化模式。在这一协作框架下,人类...
Read More近日,由vectorize-io团队在GitHub上开源的项目Hindsight引发了人工智能领域,特别是智能体(Agent)开发社区的广泛关注。该项目旨在解决当前AI智能体在长期任务和复杂交互中面临的核心挑战——记忆管理。Hindsight的...
Read More近日,AI领域知名专家、OpenAI联合创始人安德烈·卡帕西(Andrej Karpathy)在社交媒体上分享了一个名为“LLM Wiki”的GitHub Gist项目,并将其描述为一个“灵感文件”(idea file)的范例。该项目迅速在技术社区引发关注...
Read More近日,一个名为ATLAS(Adaptive Test-time Learning and Autonomous Specialization)的开源项目在开发者社区引发广泛关注。根据Hacker News上的讨论,该项目展示了一项引人瞩目的性能表现:在特定的编码基准测试中...
Read More近日,NVIDIA研究团队提出了一种名为“金鹅”(Golden Goose)的创新方法,旨在解决大语言模型(LLM)强化学习领域的一个关键瓶颈。当前,基于可验证奖励的强化学习(RLVR)是解锁LLM复杂推理能力的重要基石,但其发展...
Read More