漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-11-06 talkingdev

AWS EFA实现万亿参数模型突破:Perplexity发布分布式推理代码

人工智能研究机构Perplexity近日发布突破性代码,首次实现万亿参数混合专家模型在多个AWS服务器间的高效运行。这项技术突破使得算力基础设施相对薄弱的数据中心也能承载尖端AI模型的推理任务。当前大型语言模型面临...

Read More
2025-09-17 talkingdev

开源|揭秘月之暗面Kimi K2如何实现万亿参数模型20秒高效RL更新

月之暗面(Moonshot AI)团队在其技术博客中详细披露了Kimi K2模型在强化学习训练领域的重大突破。该团队成功实现了对1万亿参数模型的RL参数更新仅需约20秒,这一突破性进展解决了强化学习端到端训练过程中的关键效率...

Read More
2025-09-01 talkingdev

深度解析并行化策略:PyTorch与JAX设备网格架构揭秘

当前深度学习训练规模不断扩大,如何高效利用多GPU资源成为关键挑战。最新技术分析揭示了并行化策略的核心在于设备网格(Device Mesh)的智能架构设计。设备网格作为PyTorch和JAX框架的核心抽象,将GPU集群组织为N维...

Read More
2025-07-22 talkingdev

[开源]MoonshotAI发布Kimi K2技术报告:突破万亿参数模型训练瓶颈

月之暗面(MoonshotAI)团队最新发布的Kimi K2技术报告揭示了其大型语言模型系列的重大技术突破。该团队创新性地开发出MuonClip技术,通过将token高效的Muon优化器与新型QK-Clip技术相结合,成功解决了万亿参数模型训...

Read More