漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-29 talkingdev

GPU模拟器:四分钟仿真四十亿年演化史

科学家们利用GPU模拟器,成功地在四分钟内模拟了四十亿年的演化史,这项技术的出现为科学研究提供了更加高效的工具。GPU模拟器能够提高运算速度,使繁琐的计算变得更加高效,为科学家们提供了更多时间去探究宇宙的奥...

Read More
2024-07-17 talkingdev

NVIDIA全面转向开源Linux GPU内核模块

美国芯片制造商NVIDIA日前宣布,将全面转向开源Linux GPU内核模块,结束对封闭二进制Linux内核模块的支持。该举措将有助于提高NVIDIA GPU在Linux上的兼容性和稳定性,进一步加强与Linux社区的合作。NVIDIA表示,全面...

Read More
2024-07-16 talkingdev

在AMD GPU上无需修改即可运行CUDA

NVIDIA的CUDA是一种广泛使用的GPU编程框架,但是它只能在NVIDIA GPU上运行。然而,一家名为Nek5000的研究团队近日发现了一种方法,在AMD GPU上运行未经修改的CUDA代码。他们使用了名为“ROCm”,即Radeon开放计算平台...

Read More
2024-07-16 talkingdev

SCALE工具包发布:GPU编程新纪元

Spectral Compute公司近日推出了SCALE——一个通用并行图形处理单元(GPGPU)编程工具包。SCALE的主要创新之处在于它能够使得使用CUDA语言编写的程序原生编译运行在AMD的GPUs上。这个工具包接受现有的CUDA程序代码,作...

Read More
2024-07-15 talkingdev

Answer AI 开源基于WebGPU的轻量级GPU计算库

近日,Answer AI 发布了一个新的轻量级和便携式图形处理器(GPU)计算库,该库基于WebGPU构建。这个新的库可以用于编写跨 GPU 内核,并提供可移植的指令。WebGPU 是一个全新的 Web API,它旨在为现代图形和计算应用...

Read More
2024-07-15 talkingdev

OpenDiLoCo:DeepMind系统实现跨数据中心训练并保持GPU使用

来自DeepMind的分布式低通信(DiLoCo)系统已被Prime Intellect复制。该系统能够实现跨数据中心的训练,同时保持GPU的使用。OpenDiLoCo的核心是其具有高度的可扩展性,可以处理大量的数据处理和分析任务,而不会对硬...

Read More
2024-07-10 talkingdev

a16z努力通过Oxygen计划维持AI的活力

风险投资公司Andreessen Horowitz已经获取了成千上万的AI芯片,包括Nvidia H100 GPU,以此与他们的AI投资组合公司进行股权交换。这项行动是他们为了维持AI的活力并推动其发展所进行的'Oxygen'计划的一部分。Andreess...

Read More
2024-07-05 talkingdev

支持在浏览器WebGPU上运行的Florence 2模型

Florence 2是一个小型视觉模型,完全基于onnx和WebGPU在浏览器中运行。WebGPU是一种新型的Web标准,为Web应用程序提供高效的低级图形和计算功能。这种模型旨在帮助开发者更好地理解和利用WebGPU的性能优势。Onnx则是...

Read More
2024-07-01 talkingdev

深入探讨:训练MoEs模型

Mosaic团队已与PyTorch合作,撰写关于如何扩展他们的MoEs模型至数千个GPU的文章。MoEs,全称Mixture of Experts,是一种深度学习的模型结构,其核心思想是将复杂的问题分解为若干个相对简单的子问题,然后由专家系统...

Read More
2024-06-14 talkingdev

Nvidia Warp:高性能GPU模拟和图形的Python框架

Nvidia Warp是一款用于高性能GPU模拟和图形的Python框架。它提供了一个简单易用的接口,可以快速地实现GPU加速的模拟和图形计算。Nvidia Warp内置了一系列高效的数学库和图形库,可以大大提高计算效率和图像渲染质量...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page