AI算力优化的相关内容 - 漫话开发者

2025-10-20 talkingdev

阿里云发布Aegaeon GPU池化系统，声称可降低82%英伟达GPU用量

阿里云最新推出的Aegaeon GPU池化技术系统在AI算力领域实现重大突破，通过创新的资源调度机制将大模型推理所需的英伟达GPU数量从1192片缩减至213片，降幅达82%。该系统目前已在阿里云模型市场完成beta测试，其核心技...

2025-08-28 talkingdev

Cloudflare近日公开了其内部AI模型部署平台Omni的技术细节，该平台通过轻量级隔离和内存超分配技术，实现在单个GPU上并行运行多个AI模型，显著提升边缘节点的计算资源利用率。Omni平台专为边缘计算环境设计，能够动...