硬件协同设计的相关内容 - 漫话开发者

2026-01-26 talkingdev

开源|TTT-Discover：推理时强化学习新范式，让大模型实时自适应任务

近日，一个名为TTT-Discover的开源项目在GitHub上发布，其核心创新在于将强化学习（Reinforcement Learning）技术应用于大型语言模型（LLMs）的推理（Inference）阶段，而非传统的训练阶段。这一“测试时训练”（Test-...

英伟达在混合专家模型（Mixture-of-Experts，MoE）的扩展性能方面取得了重大突破。根据官方公布的数据，其最新的GB200 Blackwell NVL72服务器配置，在MoE AI模型上的性能表现相比上一代的Hopper HGX200架构实现了高...

DeepSeek研究团队以DeepSeek-V3为案例，分享了大型语言模型（LLM）训练中的硬件-模型协同设计创新成果。该研究通过多头部潜在注意力机制（Multi-head Latent Attention）、专家混合系统（Mixture of Experts）、FP8...