漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-17 talkingdev

[开源]Tile Language:专为高性能GPU/CPU内核开发设计的领域特定语言

Tile Language是一种简洁的领域特定语言(DSL),旨在简化和优化高性能GPU/CPU内核(如GEMM、Dequant GEMM、FlashAttention和LinearAttention)的开发流程。该语言采用类似Python的语法,并基于TVM(Tensor Virtual...

Read More
2025-04-16 talkingdev

[开源]OpenAI开源其FP4与MoE核心算子至Triton语言项目

OpenAI近日将其内部研发的高性能计算核心——FP4(4-bit浮点)与MoE(混合专家)系统的关键算子通过GitHub PR开源至Triton语言项目。这一举动标志着AI基础设施领域的重要进展:FP4作为新兴的低精度计算格式可显著提升...

Read More
2025-04-15 talkingdev

字节跳动团队发布Seaweed-7B:以低成本训练高性能视频生成基础模型

字节跳动团队最新发布的论文展示了如何在655k H100小时的“适度”计算预算下,训练出一个具有竞争力的70亿参数视频生成模型Seaweed-7B。该模型在多项时间敏感任务中表现出色,展现了强大的视频生成能力。这一突破不仅...

Read More
2025-04-15 talkingdev

DeepSeek推理引擎开源之路正式开启

近日,DeepSeek宣布将逐步推进其推理引擎的开源计划,这一举措旨在推动AI技术的普及与创新。DeepSeek推理引擎以其高效的模型推理能力和低延迟特性,在业界广受关注。开源后,开发者将能够自由访问和优化该引擎,进一...

Read More
2025-04-14 talkingdev

Fennel技术解析:为何成为新一代数据处理利器?

Fennel作为新兴的数据处理框架,近期在技术社区引发广泛讨论。其核心优势在于将实时流处理与批处理统一到同一API层,通过声明式编程模型显著降低开发复杂度。该平台采用Rust编写的高性能引擎,支持亚毫秒级延迟的实...

Read More
2025-04-14 talkingdev

Exwm:将Emacs打造为X Window管理器的创新实践

Exwm(Emacs X Window Manager)是一款基于GNU Emacs的X Window管理器,通过将Emacs扩展为完整的桌面环境,重新定义了开发者的工作流。Exwm利用Emacs的高度可定制性,允许用户直接在Emacs缓冲区中管理X窗口,实现了...

Read More
2025-04-07 talkingdev

[开源] Nano Aha Moment:单文件单GPU实现DeepSeek R1-Zero风格全参数调优库

McGill-NLP实验室推出的Nano Aha Moment项目在GitHub开源,该项目通过极简架构实现高性能深度学习训练——仅需单个文件和一块GPU即可完成从零开始的完整参数调优,并复现了DeepSeek R1-Zero模型的训练范式。这一突破性...

Read More
2025-04-04 talkingdev

[开源]Perplexity发布Pplx Cuda Kernels,MoE性能超越DeepSeek

人工智能领域迎来重要技术突破,Perplexity公司近日在GitHub开源了其混合专家系统(MoE)的核心计算库Pplx Cuda Kernels。这套基于CUDA的高性能计算内核在实际测试中展现出显著优势,在大规模运算场景下性能超越知名AI...

Read More
  1. Prev Page
  2. 19
  3. 20
  4. 21
  5. Next Page