漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-09-10 talkingdev

英伟达发布Rubin CPX GPU,专为超长上下文推理任务打造

英伟达正式推出全新Rubin CPX GPU,该芯片专为处理超过100万token的超长上下文窗口而设计,标志着人工智能推理基础设施迈向新阶段。采用“分解式推理”架构理念,Rubin CPX针对视频生成、复杂软件开发等长序列上下文任...

Read More
2025-09-08 talkingdev

游戏开发者注意:停止使用PNG格式传输纹理,KTX2与DDS才是更优解

近日,游戏开发领域出现重要技术建议:开发者应停止使用PNG格式存储和传输游戏纹理资源。根据专业技术分析,PNG格式虽具有无损压缩特性,但并非为实时图形渲染场景设计。新兴纹理格式KTX2和DDS凭借其专为GPU定制的技...

Read More
2025-09-08 talkingdev

分布式GPU运行时竞赛:英伟达与AMD角逐数据中心新战场

随着数据规模呈指数级增长,单GPU服务器的内存与显存容量已无法满足超大规模AI与数据分析需求。行业巨头英伟达与AMD正竞相攻克集群级数据调度技术壁垒,旨在通过软件生态构建竞争优势。初创公司Voltron Data推出的Th...

Read More
2025-09-05 talkingdev

OpenAI与博通联合设计AI芯片,斥资100亿美元订单锁定明年生产

据《金融时报》报道,OpenAI已与美国芯片巨头博通达成合作,双方将共同设计专用于人工智能计算的芯片,并计划于2025年投入生产。OpenAI已承诺投入100亿美元用于芯片订单,这些芯片将完全用于其内部AI模型训练与推理...

Read More
2025-09-02 talkingdev

英国量子算法公司Phasecraft完成3400万美元B轮融资,Plural与Playground Global等联合领投

英国量子计算算法开发公司Phasecraft近日成功完成3400万美元B轮融资,本轮融资由Plural、Playground Global和Novo Holdings共同领投。Phasecraft专注于开发能够在当前存在误差的量子计算机上实现实用价值的量子算法...

Read More
2025-09-02 talkingdev

内核32位支持走向终结?Linux社区激辩架构演进之路

在2025欧洲开源峰会上,Linux内核维护者Arnd Bergmann明确提出了逐步淘汰32位架构支持的路线图。这一提议引发技术社区激烈讨论,目前Hacker News相关话题已获得174点热度并积累163条深度技术评论。Bergmann指出,随...

Read More
2025-09-01 talkingdev

深度解析并行化策略:PyTorch与JAX设备网格架构揭秘

当前深度学习训练规模不断扩大,如何高效利用多GPU资源成为关键挑战。最新技术分析揭示了并行化策略的核心在于设备网格(Device Mesh)的智能架构设计。设备网格作为PyTorch和JAX框架的核心抽象,将GPU集群组织为N维...

Read More
2025-08-31 talkingdev

AI模型需要虚拟机:编程语言研究社区提出下一代AI系统架构新范式

ACM SIGPLAN博客最新发布的观点文章指出,当前AI模型运行环境存在严重碎片化问题,研究者提出应为AI模型构建类似Java虚拟机的标准化运行时环境。该方案能解决模型跨平台部署、资源管理和版本兼容等核心痛点,通过抽...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page