"深度学习"的相关内容 - 漫话开发者

2024-05-10 talkingdev

Image In Words数据集，图像与文字配对的新型标签方法

近日，一种新型的标签方法被研究者利用在了图片和文字的配对上，这种方法运用了两次的VLMs（视觉语言模型）扫描，产生了极为详细的图片和文字配对数据。这些配对数据的标题比以往的任何数据集都要详细，能够帮助训练...

2024-04-29 talkingdev

Luminal 是一款基于深度学习的开源框架，它在GitHub上发布并得到了广泛的关注。这个框架以速度和简单性为出发点，把快速和简易性放在首位，让用户可以在最短的时间内实现深度学习模型的快速构建和部署。Luminal能够...

2024-04-28 talkingdev

微软近日发布了一组用于训练BitNet风格模型的GPU加速内核。这些模型在准确度上没有明显下降的情况下，大大降低了内存消耗。BitNet风格模型是一种新型的深度学习模型，它的特点是使用1.58位的数据表示方法，比传统的3...

2024-04-16 talkingdev

GitHub2File是一个高效的实用工具，它可以将GitHub上的代码仓库转换成文件格式，供那些无法浏览网络的长文本模型使用。通过这个工具，研究人员和开发者可以在没有互联网连接的情况下，依然能够访问和研究GitHub上的...

2024-04-16 talkingdev

本文深入探讨了如何训练扩散模型以生成视频，如何适配图像模型，甚至在无需额外训练的情况下，如何从图像模型中生成视频。扩散模型作为一种新兴的生成模型，已经在图像生成领域取得了显著的成果。文章首先介绍了扩散...

2024-04-12 talkingdev

MoCha-Stereo即Motif Channel Attention Stereo Matching Network，是一种全新的立体匹配方法，它能够有效保留在传统立体匹配技术中常常丢失的几何结构。这一技术的出现有望在计算机视觉领域带来一场革命，尤其是在...

2024-04-10 talkingdev

Longcontext Alpaca训练技术最近取得了重大突破，通过在H100硬件上使用新的梯度累积卸载技术，成功训练了超过200,000个上下文窗口。这种创新方法使得大规模深度学习模型的训练变得更加高效，显著提高了计算资源的利...

2024-04-10 talkingdev

Visual Autoregressive Models是一个新的GitHub项目，它将图像生成视为逐步预测更高分辨率的过程。该代码库包含了用于下一分辨率预测工作的推理脚本和演示笔记本。虽然训练代码将很快公开，但目前该项目已经引起了技...