漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-09-13 talkingdev

英伟达战略调整:DGX Cloud业务收缩至内部研发,退出与AWS等云巨头竞争

根据The Information记者Anissa Gardizy的报道,英伟达正在对其云端服务DGX Cloud进行重大战略调整,将该平台从原本面向外部客户的商业化服务转变为 primarily internal R&D use(主要内部研发用途)。DGX Cloud最初...

Read More
2025-09-10 talkingdev

Firefox本地AI运行时性能大幅提升,推理速度最高加快10倍

Mozilla近日宣布对Firefox浏览器的AI运行时进行重大架构升级,将原本基于WebAssembly的“onnxruntime-web”替换为直接集成到浏览器底层的原生C++ ONNX Runtime。这一技术革新使Firefox的本地AI功能获得2-10倍的推理性...

Read More
2025-09-10 talkingdev

英伟达发布Rubin CPX GPU,专为超长上下文推理任务打造

英伟达正式推出全新Rubin CPX GPU,该芯片专为处理超过100万token的超长上下文窗口而设计,标志着人工智能推理基础设施迈向新阶段。采用“分解式推理”架构理念,Rubin CPX针对视频生成、复杂软件开发等长序列上下文任...

Read More
2025-09-05 talkingdev

OpenAI与博通联合设计AI芯片,斥资100亿美元订单锁定明年生产

据《金融时报》报道,OpenAI已与美国芯片巨头博通达成合作,双方将共同设计专用于人工智能计算的芯片,并计划于2025年投入生产。OpenAI已承诺投入100亿美元用于芯片订单,这些芯片将完全用于其内部AI模型训练与推理...

Read More
2025-08-19 talkingdev

深度解析:NVIDIA GPU与TPU架构差异如何影响大语言模型训练

最新技术分析揭示了NVIDIA GPU和谷歌TPU在人工智能计算领域的架构本质差异。现代机器学习GPU本质上是由专精于矩阵乘法的计算核心集群与高速内存条构成的异构体系,而TPU则是纯粹为矩阵运算设计的专用加速器,具有成...

Read More
2025-04-17 talkingdev

Stable Diffusion在AMD GPU上实现性能优化

Stability AI与AMD近日宣布,双方已成功针对Radeon显卡及Ryzen AI处理器优化了多款Stable Diffusion模型。这一技术突破显著提升了AMD硬件平台在生成式AI工作负载下的运行效率,实测显示推理速度最高可提升40%。该优...

Read More
2025-04-16 talkingdev

[开源]OpenAI开源其FP4与MoE核心算子至Triton语言项目

OpenAI近日将其内部研发的高性能计算核心——FP4(4-bit浮点)与MoE(混合专家)系统的关键算子通过GitHub PR开源至Triton语言项目。这一举动标志着AI基础设施领域的重要进展:FP4作为新兴的低精度计算格式可显著提升...

Read More
2025-02-05 talkingdev

MIT化学家利用生成型AI快速计算3D基因组结构

麻省理工学院(MIT)的化学家们开发了一种新方法,利用生成型人工智能(AI)确定3D基因组结构。这项技术能在几分钟内预测数千种结构,这对于研究基因组的三维组织如何影响单个细胞中的基因表达模式和功能至关重要。...

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3
  5. Next Page