漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-09-05 talkingdev

超越mmap:Linux异步I/O技术迎来重大突破

根据技术社区Bitflux的最新研究,Linux内核的异步I/O框架io_uring在性能测试中显著优于传统内存映射(mmap)技术。该研究通过详细的基准测试表明,io_uring在文件读写操作中实现了更低的延迟和更高的吞吐量,这主要得...

Read More
2025-09-05 talkingdev

Fil's Unbelievable Garbage Collector:突破性内存管理技术引发开发者热议

一项名为Fil's Unbelievable Garbage Collector(FUGC)的创新内存管理技术在开发者社区引发广泛关注。该技术通过重构传统垃圾回收机制,实现了内存分配与回收效率的显著提升,特别适用于高性能计算和实时系统领域。...

Read More
2025-08-31 talkingdev

Condor发布Cuzco RISC-V核心架构,将在Hot Chips 2025大会亮相

芯片设计领域迎来新动态——Andes Technology旗下子公司Condor Computing近日宣布,其自主研发的Cuzco RISC-V处理器核心将亮相2025年Hot Chips高性能芯片研讨会。作为一家专注于RISC-V架构IP授权的企业,Condor的商业...

Read More
2025-08-25 talkingdev

突破跨架构部署难题:Kernel-builder库实现生产级CUDA内核开发

近日,开源社区推出革命性工具库Kernel-builder,专门用于构建和部署跨硬件架构的自定义CUDA内核。该工具通过提供完整的开发框架,显著降低了高性能计算内核从开发到生产环境部署的技术门槛。根据技术文档介绍,开发...

Read More
2025-08-24 talkingdev

突破性进展:研究者用CUDA C++实现5090光速级Flash Attention算法

近日,一项名为《Writing Speed-of-Light Flash Attention for 5090 in CUDA C++》的技术研究引发广泛关注。该研究通过CUDA C++实现了针对5090硬件的光速级Flash Attention算法,显著提升了注意力机制的计算效率。Fl...

Read More
2025-08-21 talkingdev

开源|Luminal:基于搜索的开源GPU编译器,可自动为AI模型生成高性能内核

Luminal是由开发者Joe及其团队构建的一款创新型开源GPU编译器,专门针对AI模型自动生成高度优化的GPU内核。与传统机器学习库不同,Luminal采用搜索式编译方法:它将高级模型代码(如PyTorch格式)转换为底层GPU代码...

Read More
2025-08-20 talkingdev

深度解析GPU架构:从SM到Tensor Core及网络互联技术

这篇技术文章系统性地剖析了现代GPU的核心架构,重点阐述了流式多处理器(SM)的组织结构、CUDA核心与Tensor核心的协同工作机制,以及多层次内存体系的优化策略。文章不仅对比了历代GPU产品的规格演进,更从芯片层面深...

Read More
2025-08-11 talkingdev

视频平台Rumble拟以全股票交易收购德国AI云服务商Northern Data,估值或达11.7亿美元

美国上市视频平台Rumble(RUM.O)正考虑以约11.7亿美元(10亿欧元)的全股票交易收购德国AI云服务集团Northern Data AG。这一潜在收购标志着Rumble从视频领域向AI基础设施的战略扩张,也反映了当前AI云计算市场的整...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page