AI模型训练的相关内容 - 漫话开发者

2025-12-04 talkingdev

英伟达GB200 Blackwell NVL72服务器实现10倍性能飞跃，专为前沿MoE模型设计的架构突破

英伟达在混合专家模型（Mixture-of-Experts，MoE）的扩展性能方面取得了重大突破。根据官方公布的数据，其最新的GB200 Blackwell NVL72服务器配置，在MoE AI模型上的性能表现相比上一代的Hopper HGX200架构实现了高...

2025-11-07 talkingdev

中国人工智能实验室月之暗面（Moonshot AI）最新推出的Kimi K2 Thinking模型，以其创新的混合专家（MoE）推理架构引发行业关注。该模型在Humanity's Last Exam综合能力测评和BrowseComp浏览理解基准测试中，部分指标...

2025-10-26 talkingdev

微软近期在Windows 11公开测试版中推出的游戏副驾（Gaming Copilot）功能引发业界关注。该功能通过实时截图分析游戏场景，为玩家提供策略建议和操作辅助，但官方明确表示这些截图数据仅用于实时交互理解，不会用于训...

2025-09-10 talkingdev

CData Foundations 2025虚拟峰会将于9月17日（分析专场）和9月24日（AI专场）重磅登场，聚焦企业数据架构现代化与AI战略部署。本次峰会汇聚Google、AWS、Databricks和ServiceNow等科技巨头的技术专家，分享数据治理...

2025-09-06 talkingdev

人工智能公司Anthropic近日同意支付15亿美元，就与图书作者的版权侵权集体诉讼达成和解。这一案件被视为AI训练数据版权争议的标志性事件，涉及生成式AI模型使用受版权保护内容的核心法律问题。和解金额创下同类案件...

2025-09-05 talkingdev

据《金融时报》报道，OpenAI已与美国芯片巨头博通达成合作，双方将共同设计专用于人工智能计算的芯片，并计划于2025年投入生产。OpenAI已承诺投入100亿美元用于芯片订单，这些芯片将完全用于其内部AI模型训练与推理...

2025-07-03 talkingdev

Epoch AI最新研究显示，人工智能领域正经历前所未有的计算规模扩张。2024年全球已追踪到201个计算量超过10²³ FLOPs的AI大模型，较2017年仅有的2个实现指数级增长。尤其值得注意的是，以GPT-4为代表的顶尖模型已突破1...

2025-05-16 talkingdev

Nous Research近期推出的Psyche网络是一个基于Solana区块链的分布式训练系统，该系统允许拥有兼容硬件的用户自愿贡献其GPU资源用于AI模型训练。该项目的首个计划"Consilience"旨在利用20万亿个token训练一个拥有400...