泛化的相关内容 - 漫话开发者

2025-06-03 talkingdev

[论文推荐]语言模型究竟记住了多少？揭秘记忆与泛化的边界

一项突破性研究通过对比模型在随机数据（无法泛化）和真实文本上的训练表现，开发出区分记忆与泛化的新方法。研究发现，模型会先记忆训练数据直至容量饱和，随后转向学习通用模式。以GPT类Transformer为例，每个参数...

2025-05-24 talkingdev

近期大型推理模型的显著成果常被归功于思维链（CoT）技术，尤其是通过从基础大语言模型（LLM）中采样CoT进行训练以发现新推理模式的过程。然而，一项最新研究对这种解释提出了质疑。该研究通过系统性地调查中间标记...

2025-05-21 talkingdev

KumoRFM是一种预训练的关系型基础模型，其设计初衷是能够在任何数据库和预测任务上工作，而无需进行特定任务的训练。这一技术的突破性在于其通用性和适应性，能够显著降低企业在不同数据场景下部署AI模型的复杂性和...

2025-05-15 talkingdev

Pig.dev团队近日开源了Muscle-Mem项目，这是一个专为AI智能体设计的行为缓存SDK。该技术能够记录智能体在解决任务时的工具调用模式，并在再次遇到相同任务时确定性地重放这些学习到的行为轨迹。如果检测到边缘情况，...

2025-04-23 talkingdev

近日，科技社区热议的π0.5（Pi-0.5）模型在开放世界泛化能力上取得重要进展。该视觉语言模型（VLA）通过创新架构设计，在未见过的新场景中展现出超越同类模型的零样本学习能力。技术博客透露，其核心突破在于动态多...

2025-03-31 talkingdev

近日，一项名为Test-Time Visual In-Context Tuning（TT-VICT）的创新性研究在计算机视觉领域引发广泛关注。该技术突破性地提出仅利用测试样本即可实现视觉上下文学习模型（VICL）的自适应调优，有效解决了传统方法...

2025-03-19 talkingdev

谷歌DeepMind近日发布了Gemini Robotics和Gemini Robotics-ER两款AI模型，显著提升了机器人的精细运动技能和现实应用中的适应性。Gemini Robotics整合了视觉、语言与行动能力，使机器人能够完成如折纸等复杂任务。初...

2025-03-14 talkingdev

近日，GitHub上发布了一个名为REF-VLM的开源项目，该项目通过引入基于三元组的结构化表示，统一了多模态大语言模型（LLMs）中的视觉解码任务。多模态LLMs是当前人工智能领域的前沿技术，能够在处理视觉和文本信息时...