阿里云最新推出的Aegaeon GPU池化技术系统在AI算力领域实现重大突破,通过创新的资源调度机制将大模型推理所需的英伟达GPU数量从1192片缩减至213片,降幅达82%。该系统目前已在阿里云模型市场完成beta测试,其核心技...
Read More以色列深度科技公司Prisma Photonics近日完成3000万美元(约合2.2亿元人民币)新一轮融资,使其总融资额达到8000万美元。该公司开创性地利用现有光纤网络结合人工智能技术,实现对关键基础设施的实时监测。通过将普...
Read More业界瞩目的开源AI推理基准测试工具InferenceMAX正式亮相,该工具通过夜间自动化测试对Llama 70B、DeepSeek R1等主流大模型进行持续性能评估。其核心价值在于量化AI推理中的关键权衡:吞吐量(每GPU每秒处理令牌数)...
Read More近日,AI模型集成平台OpenRouter推出突破性技术方案,通过单一API接口整合GPT、Claude、Gemini、Llama、Mistral等500余个主流人工智能模型。该平台实现了请求级别的模型动态切换能力,支持根据实时价格、响应延迟等...
Read More嵌入技术作为现代检索增强生成系统的核心组件,正引发行业对AI基础设施成本结构的深度思考。最新技术分析显示,嵌入向量的生成过程主要依赖矩阵乘法和注意力机制等张量运算,其计算成本可通过浮点运算次数与硬件效率...
Read More近日,GitHub开源项目Jetski为模型上下文协议(MCP)服务器生态带来突破性解决方案。该平台通过零代码修改即可为MCP服务器注入企业级身份认证与深度分析能力,支持最新OAuth2.1标准和动态客户端注册(DCR)协议。其...
Read More据彭博社深度报道,OpenAI与英伟达、AMD等科技巨头正在通过复杂的循环交易网络助推人工智能市场估值突破万亿美元。这种企业间相互投资、交叉采购的商业模式引发行业担忧,被认为可能人为制造市场泡沫。具体表现为:A...
Read More人工智能巨头OpenAI与AMD达成战略性合作,计划在未来数年内部署总量达6吉瓦的AMD Instinct系列GPU算力基础设施。首批1吉瓦算力将于2026年底正式投入运营,标志着AMD在AI芯片领域首次获得超大规模订单。若协议全面执...
Read More