漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-12-05 talkingdev

Hugging Face新技能:Claude AI现已能微调开源大语言模型

Hugging Face平台近日推出了一项名为“Hugging Face Skills”的新功能,该功能赋予了Anthropic公司的Claude AI模型直接微调开源大语言模型的能力。这项技术突破意味着,用户现在可以通过Claude的对话界面,直接提交模...

Read More
2025-12-04 talkingdev

英伟达发布性能数据:GB200 Blackwell AI服务器对月之暗面Kimi K2、深度求索R1等MoE模型推理性能提升高达10倍

英伟达于近日公布了其最新一代GB200 Blackwell AI服务器的性能基准测试数据,结果显示,相较于前代H100/H200平台,该服务器在运行特定类型的混合专家模型时,性能提升高达10倍。此次测试重点针对中国AI公司月之暗面...

Read More
2025-10-28 talkingdev

开源|GPUI Component:Rust跨平台桌面应用GUI组件库发布

近日,开源社区迎来一款基于Rust语言的高性能跨平台GUI组件库GPUI Component。该库提供超过60个现代化UI组件,其设计理念融合了macOS、Windows及shadcn/ui的视觉风格,支持深度主题定制与灵活布局系统。技术层面,组...

Read More
2025-10-27 talkingdev

PyTorch隐藏Bug曝光:苹果MPS GPU上Adam优化器内存处理异常导致训练停滞

一位开发者在构建稀疏自编码器时遭遇了罕见的PyTorch框架底层Bug。该问题表现为模型训练损失函数持续处于平台期,经深度排查发现根本原因在于苹果硅GPU(MPS)后端执行Adam优化器时,由于内存处理机制缺陷导致部分张...

Read More
2025-10-27 talkingdev

FlashPack发布:PyTorch模型加载速度提升3-6倍

机器学习领域迎来重大突破——FlashPack技术正式发布,这项专为PyTorch设计的高吞吐量文件格式与加载机制,成功将模型检查点I/O性能推向新高度。传统模型加载过程中,GPU因等待检查点加载而产生的闲置时间一直是行业痛...

Read More
2025-10-27 talkingdev

Meta发布PyTorch原生智能体AI开发栈,重塑自主人工智能基础设施

Meta公司最新推出基于PyTorch框架的原生智能体AI开发栈,该技术套件集成了内核开发、分布式系统与强化学习三大核心模块,标志着自主人工智能开发工具链的重大升级。作为完全开源的技术解决方案,该平台突破性地支持...

Read More
2025-10-24 talkingdev

PyTorch Monarch发布:革命性分布式编程框架重塑AI集群开发范式

PyTorch团队正式推出颠覆性分布式编程框架PyTorch Monarch,该技术通过创新的‘资源本地化’设计理念,将集群编程体验提升至单机Python开发级别。框架采用网格化资源管理架构,支持在数千个GPU上实现分布式张量计算,...

Read More
2025-10-20 talkingdev

阿里云发布Aegaeon GPU池化系统,声称可降低82%英伟达GPU用量

阿里云最新推出的Aegaeon GPU池化技术系统在AI算力领域实现重大突破,通过创新的资源调度机制将大模型推理所需的英伟达GPU数量从1192片缩减至213片,降幅达82%。该系统目前已在阿里云模型市场完成beta测试,其核心技...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page