性能的相关内容 - 漫话开发者

2025-04-18 talkingdev

Goodfire完成5000万美元A轮融资，专注AI模型可解释性与行为控制研究

AI可解释性领域领军企业Goodfire近日宣布完成5000万美元A轮融资。该公司在稀疏自编码器（SAEs）等机械可解释性技术上具有深厚积累，致力于通过与闭源及开源模型提供方的深度合作，系统性地解析、引导和控制AI模型的...

2025-04-18 talkingdev

近日，MCP宣布正式支持Python运行环境，这一举措将为开发者提供更高效的开发工具和更灵活的工作流程。MCP作为一款高性能计算平台，此次集成Python支持，不仅能够兼容现有的Python生态系统，还能显著提升数据处理和机...

2025-04-18 talkingdev

DeepSeek近期推出的分布式文件系统（DFS）凭借其高性能、高可靠性和可扩展性，成为业界关注的焦点。该系统采用先进的分布式存储架构，支持海量数据的高效管理与快速访问，特别适用于AI训练、大数据分析等场景。DeepS...

2025-04-17 talkingdev

Stability AI与AMD近日宣布，双方已成功针对Radeon显卡及Ryzen AI处理器优化了多款Stable Diffusion模型。这一技术突破显著提升了AMD硬件平台在生成式AI工作负载下的运行效率，实测显示推理速度最高可提升40%。该优...

2025-04-17 talkingdev

近日，知名开源社区Hugging Face对其HELMET基准测试进行了重要升级。这一更新不仅扩展了测试覆盖的模型范围，还提供了更深入的性能洞察，特别针对当前热门的Phi-4和Jamba 1.6等长上下文大语言模型（LLM）。HELMET基...

2025-04-17 talkingdev

Tile Language是一种简洁的领域特定语言（DSL），旨在简化和优化高性能GPU/CPU内核（如GEMM、Dequant GEMM、FlashAttention和LinearAttention）的开发流程。该语言采用类似Python的语法，并基于TVM（Tensor Virtual...

2025-04-17 talkingdev

M1是一种基于Mamba架构的推理模型，通过扩展测试时间计算进行训练。虽然尚未完全达到最先进模型的水平，但M1在长上下文处理和高吞吐量任务中表现出色。这一突破为大规模语言模型的推理效率提供了新的研究方向，特别...

2025-04-16 talkingdev

NVIDIA在GitHub开源项目TensorRT-LLM中发布了名为Auto Deploy的创新工具，该技术实现了将PyTorch和Hugging Face模型转化为高效可部署格式的重大突破。通过TensorRT-LLM的优化编译器，模型推理速度可提升数倍，特别适...