漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-08-31 talkingdev

Condor发布Cuzco RISC-V核心架构,将在Hot Chips 2025大会亮相

芯片设计领域迎来新动态——Andes Technology旗下子公司Condor Computing近日宣布,其自主研发的Cuzco RISC-V处理器核心将亮相2025年Hot Chips高性能芯片研讨会。作为一家专注于RISC-V架构IP授权的企业,Condor的商业...

Read More
2025-08-29 talkingdev

开源|oLLM:轻量级Python库实现消费级GPU运行100K上下文大模型

近日,GitHub上开源项目oLLM引发开发者社区广泛关注。该项目是一个专为大上下文语言模型推理设计的轻量级Python库,其核心突破在于仅需8GB显存的消费级GPU即可运行Llama-3.1-8B-Instruct等模型处理长达10万token的上...

Read More
2025-08-27 talkingdev

构建智能体AI系统的最佳实践:生产环境中真正有效的方法

根据实际生产经验总结的智能体AI系统构建指南揭示了关键技术架构。研究表明,最优化设计采用双层系统结构:主智能体负责维护上下文和协调任务,无状态子智能体则像纯函数一样工作,不保留内存或状态。这一架构支持子...

Read More
2025-08-25 talkingdev

突破跨架构部署难题:Kernel-builder库实现生产级CUDA内核开发

近日,开源社区推出革命性工具库Kernel-builder,专门用于构建和部署跨硬件架构的自定义CUDA内核。该工具通过提供完整的开发框架,显著降低了高性能计算内核从开发到生产环境部署的技术门槛。根据技术文档介绍,开发...

Read More
2025-08-24 talkingdev

突破性进展:研究者用CUDA C++实现5090光速级Flash Attention算法

近日,一项名为《Writing Speed-of-Light Flash Attention for 5090 in CUDA C++》的技术研究引发广泛关注。该研究通过CUDA C++实现了针对5090硬件的光速级Flash Attention算法,显著提升了注意力机制的计算效率。Fl...

Read More
2025-08-22 talkingdev

实验性功能发布:Python包管理工具uv正式引入代码格式化能力

Python生态系统迎来重要更新——高性能包管理工具uv近日实验性引入了代码格式化功能。这一名为'uv format'的新功能基于Ruff格式化器构建,旨在为开发者提供统一的代码风格管理解决方案。uv由Astral公司开发,此前已以...

Read More
2025-08-21 talkingdev

Rari框架横空出世:性能超Next.js四倍,吞吐量提升400%

开发者Ryan Skinner近日发布全新全栈React框架Rari,其基于自定义Rust运行时与V8引擎构建,在性能基准测试中展现出惊人表现——比Next.js快4倍且吞吐量提升400%。该框架采用三层架构设计:Rust核心运行时负责React服务...

Read More
2025-08-21 talkingdev

开源|Luminal:基于搜索的开源GPU编译器,可自动为AI模型生成高性能内核

Luminal是由开发者Joe及其团队构建的一款创新型开源GPU编译器,专门针对AI模型自动生成高度优化的GPU内核。与传统机器学习库不同,Luminal采用搜索式编译方法:它将高级模型代码(如PyTorch格式)转换为底层GPU代码...

Read More
  1. Prev Page
  2. 18
  3. 19
  4. 20
  5. Next Page