GPU的相关内容 - 漫话开发者

2025-10-20 talkingdev

阿里云发布Aegaeon GPU池化系统，声称可降低82%英伟达GPU用量

阿里云最新推出的Aegaeon GPU池化技术系统在AI算力领域实现重大突破，通过创新的资源调度机制将大模型推理所需的英伟达GPU数量从1192片缩减至213片，降幅达82%。该系统目前已在阿里云模型市场完成beta测试，其核心技...

2025-10-17 talkingdev

来自大规模实验的研究团队发布了名为ScaleRL的创新框架，这是首个针对大型语言模型强化学习计算扩展的系统性研究方法。该研究通过超过40万GPU小时的实验数据，构建了可预测的S型计算-性能曲线，揭示了RL训练中算法改...

2025-10-14 talkingdev

业界瞩目的开源AI推理基准测试工具InferenceMAX正式亮相，该工具通过夜间自动化测试对Llama 70B、DeepSeek R1等主流大模型进行持续性能评估。其核心价值在于量化AI推理中的关键权衡：吞吐量（每GPU每秒处理令牌数）...

2025-10-13 talkingdev

嵌入技术作为现代检索增强生成系统的核心组件，正引发行业对AI基础设施成本结构的深度思考。最新技术分析显示，嵌入向量的生成过程主要依赖矩阵乘法和注意力机制等张量运算，其计算成本可通过浮点运算次数与硬件效率...

2025-10-09 talkingdev

据彭博社深度报道，OpenAI与英伟达、AMD等科技巨头正在通过复杂的循环交易网络助推人工智能市场估值突破万亿美元。这种企业间相互投资、交叉采购的商业模式引发行业担忧，被认为可能人为制造市场泡沫。具体表现为：A...

2025-10-07 talkingdev

人工智能巨头OpenAI与AMD达成战略性合作，计划在未来数年内部署总量达6吉瓦的AMD Instinct系列GPU算力基础设施。首批1吉瓦算力将于2026年底正式投入运营，标志着AMD在AI芯片领域首次获得超大规模订单。若协议全面执...

2025-09-25 talkingdev

高通正式揭晓其最新旗舰移动处理器骁龙8 Elite Gen 5的详细技术规格，官方宣称该芯片在CPU性能上实现同比20%的提升，GPU性能增幅达23%。这一突破主要基于新一代定制核心架构和能效优化设计，旨在应对高端智能手机对A...

2025-09-13 talkingdev

根据The Information记者Anissa Gardizy的报道，英伟达正在对其云端服务DGX Cloud进行重大战略调整，将该平台从原本面向外部客户的商业化服务转变为 primarily internal R&D use（主要内部研发用途）。DGX Cloud最初...