长文本推理的相关内容 - 漫话开发者

2026-06-03 talkingdev

开源| Wall Attention：新型注意力机制突破长文本推理瓶颈，channels维度引入乘性衰减

在处理长文本或长时间序列时，标准Transformer模型的内存占用和计算复杂度会随序列长度平方级增长，并面临信息稀释问题。GitHub上最新开源的“Wall Attention”项目提出了一种极具创新性的注意力变体机制：通过引入带...

2025-11-22 talkingdev

据《华尔街日报》报道，中国人工智能公司月之暗面（Moonshot AI）正启动新一轮数亿美元规模的融资，估值预计达40亿美元。该公司开发的Kimi智能助手凭借超长上下文处理能力成为行业焦点，目前已向潜在投资者透露计划...