硬件加速的相关内容 - 漫话开发者

2025-10-13 talkingdev

开源|WireGuard FPGA：基于低成本Artix7 FPGA的硬件级VPN实现，开源工具链打造全速隐私保护方案

近日，GitHub上开源项目wireguard-fpga引发技术社区广泛关注。该项目通过低成本的Artix7 FPGA芯片，结合开源工具链，实现了WireGuard VPN协议的硬件级全速处理能力。其核心突破在于利用FPGA并行架构，使VPN数据传输...

2025-09-08 talkingdev

近日，游戏开发领域出现重要技术建议：开发者应停止使用PNG格式存储和传输游戏纹理资源。根据专业技术分析，PNG格式虽具有无损压缩特性，但并非为实时图形渲染场景设计。新兴纹理格式KTX2和DDS凭借其专为GPU定制的技...

2025-07-16 talkingdev

KDE社区宣布其电视操作系统项目Plasma Bigscreen在沉寂多时后迎来重大更新，新版界面全面重构，优化了整体Shell层的用户体验。作为开源生态中罕见的电视端解决方案，该项目采用Qt框架开发，支持硬件加速解码和语音交...

2025-06-30 talkingdev

PyTorch与vLLM近日宣布深化技术整合，新增支持量化、注意力机制定制及异构硬件加速等关键功能。这一合作标志着两大开源框架在优化大语言模型（LLM）推理性能方面取得重要突破：量化技术可降低模型计算资源消耗达4-8...

2025-06-25 talkingdev

近日一篇关于GPU基础知识的科普文章在技术社区引发广泛讨论，该文章系统梳理了图形处理单元的核心技术原理和发展历程。作为现代计算的核心组件，GPU最初专为图形渲染设计，现已广泛应用于深度学习、科学计算等领域。...

2025-04-17 talkingdev

Stability AI与AMD近日宣布，双方已成功针对Radeon显卡及Ryzen AI处理器优化了多款Stable Diffusion模型。这一技术突破显著提升了AMD硬件平台在生成式AI工作负载下的运行效率，实测显示推理速度最高可提升40%。该优...

2024-11-19 talkingdev

近期，人工智能领域的进步再次迎来了一个重要的里程碑。Llama 3.1 405B，一个领先的大型语言模型，现在在Cerebras AI加速器上运行时，实现了每秒969个令牌的处理速度，这在业界是一个显著的性能提升。Cerebras Infer...

2024-03-18 talkingdev

本文详细介绍了Lamini公司在AMD GPU上进行大型语言模型训练的技术架构。这包括了他们所使用的调度程序、模型训练技术以及其他相关技术细节。Lamini的技术团队选择了AMD GPU作为硬件加速平台，以优化模型训练的性能和...