漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-11-20 talkingdev

开源|PyTorch生态迎来科学机器学习新成员PINA

近日,开源科学机器学习库PINA正式加入PyTorch生态系统,为科研与工程领域带来突破性工具。该库提供模块化、可扩展的工作流,专门针对偏微分方程求解器、物理系统模拟等科学计算任务进行优化。通过深度融合物理先验...

Read More
2025-10-27 talkingdev

PyTorch隐藏Bug曝光:苹果MPS GPU上Adam优化器内存处理异常导致训练停滞

一位开发者在构建稀疏自编码器时遭遇了罕见的PyTorch框架底层Bug。该问题表现为模型训练损失函数持续处于平台期,经深度排查发现根本原因在于苹果硅GPU(MPS)后端执行Adam优化器时,由于内存处理机制缺陷导致部分张...

Read More
2025-10-27 talkingdev

FlashPack发布:PyTorch模型加载速度提升3-6倍

机器学习领域迎来重大突破——FlashPack技术正式发布,这项专为PyTorch设计的高吞吐量文件格式与加载机制,成功将模型检查点I/O性能推向新高度。传统模型加载过程中,GPU因等待检查点加载而产生的闲置时间一直是行业痛...

Read More
2025-10-27 talkingdev

Meta发布PyTorch原生智能体AI开发栈,重塑自主人工智能基础设施

Meta公司最新推出基于PyTorch框架的原生智能体AI开发栈,该技术套件集成了内核开发、分布式系统与强化学习三大核心模块,标志着自主人工智能开发工具链的重大升级。作为完全开源的技术解决方案,该平台突破性地支持...

Read More
2025-10-24 talkingdev

PyTorch Monarch发布:革命性分布式编程框架重塑AI集群开发范式

PyTorch团队正式推出颠覆性分布式编程框架PyTorch Monarch,该技术通过创新的‘资源本地化’设计理念,将集群编程体验提升至单机Python开发级别。框架采用网格化资源管理架构,支持在数千个GPU上实现分布式张量计算,...

Read More
2025-09-16 talkingdev

PyTorch与vLLM联手实现分解式推理,大幅提升大语言模型生产环境性能

Meta公司内部团队与vLLM、PyTorch展开深度技术合作,成功推出预填充/解码分离技术(prefill/decode disaggregation),这项突破性技术显著提升了大规模语言模型在生产环境中的推理性能。通过将推理过程分解为预填充...

Read More
2025-09-16 talkingdev

开源|RustGPT:纯Rust编写的Transformer架构大语言模型

RustGPT是一项具有里程碑意义的开源项目,它首次实现了完全基于Rust编程语言的大型语言模型(LLM)开发,不依赖任何外部机器学习框架。该项目采用纯Rust代码构建,仅使用ndarray库进行矩阵运算,彻底摆脱了对PyTorch...

Read More
2025-09-04 talkingdev

AI生成Metal内核将PyTorch在苹果设备推理速度提升87%

研究人员通过前沿AI技术实现了重大突破:利用自主生成的Metal GPU内核,将PyTorch在苹果设备上的推理速度平均提升1.87倍。这项研究测试了215个PyTorch模型,其中部分工作负载甚至达到基线性能的数百倍加速。该技术采...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page