OpenAI宣布启动其欧洲首个AI数据中心项目——挪威星际之门(Stargate Norway),作为OpenAI for Countries计划的重要组成部分。该设施预计到2026年将提供230兆瓦的电力容量和10万块NVIDIA GPU的算力支持,通过充分利用...
Read MoreRust-GPU项目组近日宣布其官方网站正式上线,标志着Rust语言向全平台GPU编程迈出重要一步。该项目旨在扩展Rust生态系统,使其能够支持各种GPU架构的编程需求。通过Rust-GPU,开发者可以利用Rust的内存安全性和高性能...
Read MoreThree.js的实例化渲染技术(Instancing)通过单次绘制调用实现同几何体与材质的海量对象渲染,将GPU调用从数千次压缩至1-2次,成为WebGL性能优化的关键方案。本文以React Three Fiber的`Instances`组件为核心,详解...
Read More一项名为“Power”注意力的创新技术通过引入超参数p,实现了对状态大小的独立控制,有效解决了长上下文训练中计算成本平衡的难题。该机制在长序列任务中表现优于标准注意力,并支持定制GPU内核,在64k上下文长度下速度...
Read MoreGitHub开源项目Uzu为Apple Silicon平台带来突破性AI推理解决方案。该项目采用混合GPU/MPSGraph架构,显著提升计算效率,同时提供简洁API和统一模型配置,支持Swift及命令行接口绑定。其核心创新在于实现可追踪的计算...
Read More近期,一项名为GPUHammer的研究揭示了针对GPU内存的Rowhammer攻击的可行性,这一发现引起了广泛关注。Rowhammer攻击是一种通过频繁访问特定内存单元,导致相邻单元发生位翻转的安全漏洞。此前,这种攻击主要针对DRAM...
Read More近日,研究人员发布了新一代商业级大语言模型Mercury,该模型基于扩散模型技术,采用Transformer架构进行参数化,并能够并行预测多个token。报告重点介绍了Mercury Coder,这是首套专为编程应用设计的扩散大语言模型...
Read More法国研究机构Kyutai Labs近日开源其文本转语音(TTS)系统Kyutai TTS,该技术凭借L40S GPU实现32请求并行处理时仅350毫秒的延迟表现,达到行业领先水平。系统创新性地提供单词级时间戳输出功能,英语和法语的字错误...
Read More