漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-08-09 talkingdev

技术解析:ChatGPT如何支撑7亿周活用户?揭秘大规模AI服务的工程奇迹

OpenAI首席执行官Sam Altman近日透露,ChatGPT每周服务用户量已达7亿人次,而普通开发者甚至难以在本地单机运行一个GPT-4级别的模型。这引发了技术社区对超大规模AI服务背后工程架构的热议。专家分析指出,支撑这一...

Read More
2025-08-07 talkingdev

Rust编写GPU内核驱动:深入解析GPU驱动工作原理

本文通过Vulkan(VkCube)渲染旋转立方体的实例,深入浅出地讲解了GPU驱动架构的基础知识,重点剖析了用户模式驱动(UMD)与内核模式驱动(KMD)的协作机制。UMD负责将高级API命令转换为底层GPU指令,而KMD则掌管内...

Read More
2025-08-01 talkingdev

OpenAI启动挪威星际之门项目,以可持续AI基础设施赋能欧洲市场

OpenAI宣布启动其欧洲首个AI数据中心项目——挪威星际之门(Stargate Norway),作为OpenAI for Countries计划的重要组成部分。该设施预计到2026年将提供230兆瓦的电力容量和10万块NVIDIA GPU的算力支持,通过充分利用...

Read More
2025-07-27 talkingdev

Rust-GPU正式开源,将支持全平台GPU编程

Rust-GPU项目组近日宣布其官方网站正式上线,标志着Rust语言向全平台GPU编程迈出重要一步。该项目旨在扩展Rust生态系统,使其能够支持各种GPU架构的编程需求。通过Rust-GPU,开发者可以利用Rust的内存安全性和高性能...

Read More
2025-07-22 talkingdev

Three.js实例化技术:高效渲染海量3D对象的秘密

Three.js的实例化渲染技术(Instancing)通过单次绘制调用实现同几何体与材质的海量对象渲染,将GPU调用从数千次压缩至1-2次,成为WebGL性能优化的关键方案。本文以React Three Fiber的`Instances`组件为核心,详解...

Read More
2025-07-18 talkingdev

[论文推荐] 突破长文本限制:新型“Power”注意力机制实现高效训练

一项名为“Power”注意力的创新技术通过引入超参数p,实现了对状态大小的独立控制,有效解决了长上下文训练中计算成本平衡的难题。该机制在长序列任务中表现优于标准注意力,并支持定制GPU内核,在64k上下文长度下速度...

Read More
2025-07-16 talkingdev

Uzu:专为苹果芯片优化的高性能AI模型推理引擎

GitHub开源项目Uzu为Apple Silicon平台带来突破性AI推理解决方案。该项目采用混合GPU/MPSGraph架构,显著提升计算效率,同时提供简洁API和统一模型配置,支持Swift及命令行接口绑定。其核心创新在于实现可追踪的计算...

Read More
2025-07-16 talkingdev

GPUHammer:针对GPU内存的Rowhammer攻击已具备实际威胁

近期,一项名为GPUHammer的研究揭示了针对GPU内存的Rowhammer攻击的可行性,这一发现引起了广泛关注。Rowhammer攻击是一种通过频繁访问特定内存单元,导致相邻单元发生位翻转的安全漏洞。此前,这种攻击主要针对DRAM...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page