上下文学习的相关内容 - 漫话开发者

2026-04-23 talkingdev

上下文是软件，权重是硬件：AI学习的核心差异比你想象的更重要

在大型语言模型领域，一种新的视角正在引发讨论：将上下文视为“软件”，而将权重视为“硬件”。这种比喻揭示了模型运作的本质差异。上下文（如KV缓存）动态地调节模型的激活值，为特定任务提供临时性的“编程”，从而实现...

2025-11-11 talkingdev

Meta近日发布了名为'全语种自动语音识别'（Omnilingual Automatic Speech Recognition）的AI模型套件，这项突破性技术将自动语音识别能力扩展到1600多种语言，覆盖全球绝大多数已知语言体系。该系统的核心创新在于其...

2025-08-15 talkingdev

近期，一项关于大语言模型（LLM）上下文学习（ICL）能力的研究取得了重要突破。研究人员提出了一种理论框架，解释了非线性残差变换器如何通过向量算术执行事实召回ICL任务。该研究基于分层概念建模，证明了通过梯度...

2025-03-31 talkingdev

近日，一项名为Test-Time Visual In-Context Tuning（TT-VICT）的创新性研究在计算机视觉领域引发广泛关注。该技术突破性地提出仅利用测试样本即可实现视觉上下文学习模型（VICL）的自适应调优，有效解决了传统方法...

2024-03-19 talkingdev

下一个标记预测作为一个简单的目标，却能引发复杂的行为模式。最新的研究发现，仅通过一个自注意力层并结合梯度下降法训练，就能将问题分解为困难的检索和柔和的组合，这一过程不仅实现了上下文学习，还显著提升了模...

2024-03-13 talkingdev

Cognition发布了一款名为Devin的新系统，该系统在测试AI编写代码能力的挑战性基准测试SWE-Bench上获得了14%的分数，而GPT-4则只得到了1.7%。该模型显示具有强大的上下文学习能力。

2023-05-01 talkingdev

InstructCTG是一种受自然语言描述和演示控制的文本生成框架。这种灵活的方法通过少量训练即可在上下文学习和少量任务泛化中实现模型的自适应，并保持生成的质量和速度。以下是该框架的三个核心点： - InstructCTG使...