阿里云发布Aegaeon GPU池化系统,声称可降低82%英伟达GPU用量
talkingdev • 2025-10-20
4600 views
阿里云最新推出的Aegaeon GPU池化技术系统在AI算力领域实现重大突破,通过创新的资源调度机制将大模型推理所需的英伟达GPU数量从1192片缩减至213片,降幅达82%。该系统目前已在阿里云模型市场完成beta测试,其核心技术在于构建动态GPU资源池,使单张GPU可同时服务多个大型语言模型的推理任务。通过智能调度算法,Aegaeon系统能有效解决AI工作负载中常见的资源闲置问题,实现GPU算力的细粒度切分与弹性分配。这一技术突破不仅大幅降低AI模型部署的硬件成本,更通过提升单位GPU的模型服务密度,为行业提供了应对算力紧缺的新思路,可能重塑未来AI基础设施的架构设计。
核心要点
- Aegaeon系统实现82%的GPU用量降低,单任务GPU需求从1192片降至213片
- 采用GPU池化技术实现单卡多模型并发服务,优化LLM工作负载管理
- 技术已完成模型市场beta测试,有效解决AI算力资源闲置问题