漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-08-24 talkingdev

突破性进展:研究者用CUDA C++实现5090光速级Flash Attention算法

近日,一项名为《Writing Speed-of-Light Flash Attention for 5090 in CUDA C++》的技术研究引发广泛关注。该研究通过CUDA C++实现了针对5090硬件的光速级Flash Attention算法,显著提升了注意力机制的计算效率。Fl...

Read More
2025-08-24 talkingdev

线阵相机图像处理技术在列车摄影中的应用突破

近日,一项基于线阵相机图像处理技术的列车摄影方案引发技术社区关注。该方案通过高精度线阵相机捕捉运动中的列车图像,结合自适应曝光控制与实时图像拼接算法,有效解决了传统面阵相机在高速场景下的运动模糊问题。...

Read More
2025-08-21 talkingdev

开源|Luminal:基于搜索的开源GPU编译器,可自动为AI模型生成高性能内核

Luminal是由开发者Joe及其团队构建的一款创新型开源GPU编译器,专门针对AI模型自动生成高度优化的GPU内核。与传统机器学习库不同,Luminal采用搜索式编译方法:它将高级模型代码(如PyTorch格式)转换为底层GPU代码...

Read More
2025-08-20 talkingdev

开源|Lemonade:高性能本地大语言模型推理服务器

Lemonade是一个专为现代计算硬件优化的开源推理服务器,致力于帮助开发者和研究者在本地高效运行大型语言模型。该项目通过集成最先进的推理引擎,可自动适配不同厂商的NPU(神经网络处理器)和GPU硬件平台,实现计算...

Read More
2025-08-19 talkingdev

开源|OpenMower——开源智能割草机项目引发开发者热议

近日,GitHub上名为OpenMower的开源智能割草机项目引发广泛关注。该项目由开发者ClemensElflein发起,旨在通过开源方式推动智能割草技术的创新。OpenMower采用模块化设计,支持用户自行改装普通割草机为智能设备,具...

Read More
2025-08-18 talkingdev

Marginalia Search利用NVMe SSD技术大幅提升索引性能

Marginalia Search通过重新设计数据结构以更好地利用现代硬件(NVMe SSD),显著提升了其索引性能。这一改进涉及用确定性的基于块的跳跃列表替代传统的B树,并采用直接模式读取。令人惊讶的是,研究发现较大的块大小...

Read More
2025-08-17 talkingdev

OpenAI开源模型gpt-oss-120b性能测试报告:不同托管平台表现差异显著

近日,Artificial Analysis发布了一项针对OpenAI开源大语言模型gpt-oss-120b的性能基准测试报告。该测试聚焦于同一模型在不同托管服务提供商环境中的表现差异,结果显示各平台间的性能存在明显波动。作为当前参数规...

Read More
2025-08-16 talkingdev

Meta最新PC VR头显原型Boba 3上手体验:180°×120°超宽视场角,外形类似Quest 3

在SIGGRAPH 2025大会上,UploadVR记者David Heaney体验了Meta最新研发的PC VR头显原型Boba 3。该设备采用与Quest 3相似的外形设计,但实现了180°×120°的超宽视场角,显著提升了沉浸感。作为Meta在VR领域的技术探索,...

Read More
  1. Prev Page
  2. 14
  3. 15
  4. 16
  5. Next Page