漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-15 talkingdev

论文:深度学习新模型,无状态序列并行推理

深度学习领域有了一项新的突破。研究人员开发出了一个新的状态空间模型,这一模型使用双重转移函数表示。其主要特点是一个无状态的序列并行推理算法。这种新的推理算法能够在处理大规模数据时,有效提高计算效率和准...

Read More
2024-05-15 talkingdev

Model Explorer:模型图形的直观分层可视化

深度学习模型的复杂性使得理解它们变得困难。为了解决这个问题,研究人员提出了一个名为“Model Explorer”的工具,它提供了直观、分层的可视化模型图形。这个工具可以帮助用户更好地理解深度学习模型,而无需阅读大量...

Read More
2024-05-14 talkingdev

TEFN深度学习模型,提升长时间序列预测

时序证据融合网络(TEFN)是GitHub最近发布的一种全新深度学习模型,旨在提升长期时间序列预测的准确性和稳定性。这一模型结合了信息融合和证据理论,通过专门的模块来提高预测的准确性和稳定性。其主要特点是能够综...

Read More
2024-05-14 talkingdev

MatterSim:一种跨元素、温度和压力的深度学习原子模型

模拟器在人工智能中可以作为收集训练数据或模型学习交互的强大工具。这种模拟器可以用来模拟各种元素之间的不同原子互动。这种先进的深度学习原子模型被命名为MatterSim,能够尽可能地模拟现实中的原子行为,无论是...

Read More
2024-05-10 talkingdev

Image In Words数据集,图像与文字配对的新型标签方法

近日,一种新型的标签方法被研究者利用在了图片和文字的配对上,这种方法运用了两次的VLMs(视觉语言模型)扫描,产生了极为详细的图片和文字配对数据。这些配对数据的标题比以往的任何数据集都要详细,能够帮助训练...

Read More
2024-04-29 talkingdev

Luminal:以速度和简单性为核心的深度学习框架

Luminal 是一款基于深度学习的开源框架,它在GitHub上发布并得到了广泛的关注。这个框架以速度和简单性为出发点,把快速和简易性放在首位,让用户可以在最短的时间内实现深度学习模型的快速构建和部署。Luminal能够...

Read More
2024-04-28 talkingdev

微软开源BitBLAS:优化1.58位网络内核

微软近日发布了一组用于训练BitNet风格模型的GPU加速内核。这些模型在准确度上没有明显下降的情况下,大大降低了内存消耗。BitNet风格模型是一种新型的深度学习模型,它的特点是使用1.58位的数据表示方法,比传统的3...

Read More
2024-04-16 talkingdev

GitHub2File:将GitHub仓库转换为文件,助力离线深度学习

GitHub2File是一个高效的实用工具,它可以将GitHub上的代码仓库转换成文件格式,供那些无法浏览网络的长文本模型使用。通过这个工具,研究人员和开发者可以在没有互联网连接的情况下,依然能够访问和研究GitHub上的...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page