GPU的相关内容 - 漫话开发者

2026-06-24 talkingdev

开源｜Graphsignal Profiler：生产级AI推理性能剖析利器，助力模型与GPU极致优化

Graphsignal Profiler 是一个面向生产环境的推理性能剖析平台，专为大规模 AI 推理场景设计。它能够跨越模型、推理引擎、GPU 及其他加速器，提供全栈式的性能可见性，帮助工程师精准定位瓶颈并优化推理效率。与传统...

2026-06-22 talkingdev

Morph LLM近期发布了一系列针对开源代码生成模型的优化技术，旨在解决当前推理效率瓶颈。首先，团队通过训练一个专注于模型自身编码输出（而非通用互联网数据）的“起草模型”（drafter），在投机解码中取得了显著加速...

2026-06-18 talkingdev

NVIDIA近日宣布其XR AI平台进入公开测试阶段，为增强现实（AR）眼镜和扩展现实（XR）头显开发者提供了一个关键的底层基础设施。该平台是一个开源库，旨在填补当前硬件就绪但缺乏集成本地AI体验的空白。它允许开发者...

2026-06-04 talkingdev

Gooey是一个专为Zig编程语言设计的GPU加速声明式UI框架，旨在通过利用Metal、Vulkan和WebGPU等原生平台图形库，在macOS、Linux及Web浏览器上构建高性能用户界面。该框架采用混合立即模式与保留模式的架构设计，兼顾...

2026-05-19 talkingdev

近日，一款名为HRM-Text的新型文本生成模型在GitHub上开源，引发了AI社区的广泛关注。该模型基于HRM架构，参数规模为10亿（1B），但其最大的亮点在于惊人的训练效率。据项目介绍，HRM-Text的训练所需的计算资源和数...

2026-05-18 talkingdev

在大型代码库中，AI编程助手（如Claude Code）进行代码搜索时，常常面临效率瓶颈：当直接查找失败，它们会退回到grep等传统工具或读取整个文件，这往往导致大量的Token消耗，且检索质量不佳。针对这一痛点，开发者St...

2026-05-11 talkingdev

英伟达在全球人工智能热潮中不仅是最直接的受益者，更正在主动成为行业最大的“金主”。据最新报道，英伟达在2026年以来已累计做出超过400亿美元的股权投资承诺，通过真金白银深度介入并主导整个AI供应链。英伟达此举...

2026-05-08 talkingdev

谷歌近期在Gemma大型语言模型上实现了令人瞩目的推理速度提升，成功将性能提升了三倍。这一突破性进展的核心在于采用了“投机解码”（Speculative Decoding）技术。该技术的工作原理是部署一个轻量级、速度极快的“草稿...