漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-07-16 talkingdev

Uzu:专为苹果芯片优化的高性能AI模型推理引擎

GitHub开源项目Uzu为Apple Silicon平台带来突破性AI推理解决方案。该项目采用混合GPU/MPSGraph架构,显著提升计算效率,同时提供简洁API和统一模型配置,支持Swift及命令行接口绑定。其核心创新在于实现可追踪的计算...

Read More
2025-07-16 talkingdev

GPUHammer:针对GPU内存的Rowhammer攻击已具备实际威胁

近期,一项名为GPUHammer的研究揭示了针对GPU内存的Rowhammer攻击的可行性,这一发现引起了广泛关注。Rowhammer攻击是一种通过频繁访问特定内存单元,导致相邻单元发生位翻转的安全漏洞。此前,这种攻击主要针对DRAM...

Read More
2025-07-08 talkingdev

[论文推荐] Mercury:基于扩散模型的超高速语言模型

近日,研究人员发布了新一代商业级大语言模型Mercury,该模型基于扩散模型技术,采用Transformer架构进行参数化,并能够并行预测多个token。报告重点介绍了Mercury Coder,这是首套专为编程应用设计的扩散大语言模型...

Read More
2025-07-04 talkingdev

KyutaiTTS开源-支持流式传输与低延迟的TTS引擎

法国研究机构Kyutai Labs近日开源其文本转语音(TTS)系统Kyutai TTS,该技术凭借L40S GPU实现32请求并行处理时仅350毫秒的延迟表现,达到行业领先水平。系统创新性地提供单词级时间戳输出功能,英语和法语的字错误...

Read More
2025-06-30 talkingdev

PyTorch与vLLM深化集成,提升大语言模型推理效率

PyTorch与vLLM近日宣布深化技术整合,新增支持量化、注意力机制定制及异构硬件加速等关键功能。这一合作标志着两大开源框架在优化大语言模型(LLM)推理性能方面取得重要突破:量化技术可降低模型计算资源消耗达4-8...

Read More
2025-06-27 talkingdev

FLUX.1 Kontext [dev]发布开源权重:消费级硬件实现专业级图像编辑性能

FLUX.1 Kontext [dev]作为一款拥有120亿参数的开源模型,突破性地在消费级硬件上实现了媲美商业闭源软件的图像编辑性能。该模型采用FLUX.1非商业许可协议开放权重,为学术研究和非商业应用提供免费访问权限。技术亮...

Read More
2025-06-25 talkingdev

GPU基础知识科普:从核心原理到应用场景

近日一篇关于GPU基础知识的科普文章在技术社区引发广泛讨论,该文章系统梳理了图形处理单元的核心技术原理和发展历程。作为现代计算的核心组件,GPU最初专为图形渲染设计,现已广泛应用于深度学习、科学计算等领域。...

Read More
2025-06-20 talkingdev

LLM编译技术重大突破:单核化Megakernel实现低延迟推理

传统大型语言模型(LLM)系统普遍存在硬件利用率低下的问题,主要源于GPU内核的序列化启动及跨设备通信开销。一支研究团队创新性地开发出专用编译器,可将LLM推理过程自动编译为单一megakernel(超级内核),通过三大...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page