英伟达于近日公布了其最新一代GB200 Blackwell AI服务器的性能基准测试数据,结果显示,相较于前代H100/H200平台,该服务器在运行特定类型的混合专家模型时,性能提升高达10倍。此次测试重点针对中国AI公司月之暗面...
Read More前沿科技领域迎来一项重要整合:高性能JavaScript运行时、打包器和包管理器Bun已被AI研究公司Anthropic正式收购。此次收购为Bun项目提供了长期稳定的资源支持,使其能更专注于构建最先进的JavaScript开发工具链,特...
Read More亚马逊云科技(AWS)在自研AI芯片领域持续发力,近日正式发布了其第三代AI训练专用芯片——Trainium3。这款芯片在性能规格上表现亮眼,标志着AWS在降低AI计算成本、提供多元化算力解决方案方面迈出了重要一步。值得注...
Read More在大型语言模型推理优化领域,Prompt缓存技术正成为提升服务效率、降低计算成本的关键前沿技术。本文深入解析了Prompt缓存的核心工作原理,特别聚焦于vLLM框架中创新的Paged Attention机制及其实现的自动前缀缓存。...
Read More近日,GitHub开源项目Acontext正式发布,这是一个专为自学习智能体设计的上下文数据平台。该平台旨在通过统一的上下文管理,解决当前AI代理在持续学习过程中面临的数据碎片化和上下文丢失问题。Acontext的核心价值在...
Read More半导体研究机构SemiAnalysis最新报告系统拆解了微软的AI战略布局。该战略以与OpenAI的深度合作为核心,结合数据中心扩建、Neocloud云服务租赁模式、GitHub Copilot开发者工具链、MAI系列模型及自研AI芯片Maia,构建...
Read More随着人工智能军备竞赛白热化,全球科技巨头正以前所未有的规模投入尖端计算设施建设。据行业分析显示,这些企业通过企业债券、资产证券化市场、私募融资及表外实体等日益复杂的债务融资工具筹措资金,其融资规模已引...
Read More根据CNBC最新报道,全球海底光缆建设正迎来历史性投资浪潮。2025至2027年间,海底光缆项目投资总额预计达到130亿美元,较2022-2024年期间的投入规模实现近乎翻倍增长。这一爆发式增长主要受人工智能基础设施建设的强...
Read More