GPU的相关内容 - 漫话开发者

2025-08-13 talkingdev

从零构建搜索引擎：两个月内完成30亿神经嵌入的Web搜索系统

本文深度剖析了一个从零构建的Web搜索引擎项目，该项目在短短两个月内实现了包括30亿SBERT神经嵌入生成、2.8亿网页爬取与索引、查询延迟优化及服务网格部署等核心技术突破。项目团队动用了200块GPU组成的计算集群，...

2025-08-09 talkingdev

据Sherwood News分析师Luke Kawa最新分析，英伟达(Nvidia)已成为标普500指数中自1981年以来权重最高的个股，同时其作为指数龙头股的市盈率也达到了自1999年微软以来的最高水平。这一里程碑式的成就凸显了英伟达在人...

2025-08-09 talkingdev

OpenAI首席执行官Sam Altman近日透露，ChatGPT每周服务用户量已达7亿人次，而普通开发者甚至难以在本地单机运行一个GPT-4级别的模型。这引发了技术社区对超大规模AI服务背后工程架构的热议。专家分析指出，支撑这一...

2025-08-07 talkingdev

本文通过Vulkan（VkCube）渲染旋转立方体的实例，深入浅出地讲解了GPU驱动架构的基础知识，重点剖析了用户模式驱动（UMD）与内核模式驱动（KMD）的协作机制。UMD负责将高级API命令转换为底层GPU指令，而KMD则掌管内...

2025-08-01 talkingdev

OpenAI宣布启动其欧洲首个AI数据中心项目——挪威星际之门（Stargate Norway），作为OpenAI for Countries计划的重要组成部分。该设施预计到2026年将提供230兆瓦的电力容量和10万块NVIDIA GPU的算力支持，通过充分利用...

2025-07-27 talkingdev

Rust-GPU项目组近日宣布其官方网站正式上线，标志着Rust语言向全平台GPU编程迈出重要一步。该项目旨在扩展Rust生态系统，使其能够支持各种GPU架构的编程需求。通过Rust-GPU，开发者可以利用Rust的内存安全性和高性能...

2025-07-22 talkingdev

Three.js的实例化渲染技术（Instancing）通过单次绘制调用实现同几何体与材质的海量对象渲染，将GPU调用从数千次压缩至1-2次，成为WebGL性能优化的关键方案。本文以React Three Fiber的`Instances`组件为核心，详解...

2025-07-18 talkingdev

一项名为“Power”注意力的创新技术通过引入超参数p，实现了对状态大小的独立控制，有效解决了长上下文训练中计算成本平衡的难题。该机制在长序列任务中表现优于标准注意力，并支持定制GPU内核，在64k上下文长度下速度...