漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-09 talkingdev

Stability AI开发高保真度文本转语音模型,使用合成注释训练

这些文本转语音模型由Stability AI开发,可以通过精确的自然语言指令进行引导。由于没有适合生成的具有正确文本描述的大型数据集,因此其创作者合成注释了大量的语音语料库进行训练。这是注释,上字幕和训练生成模型...

Read More
2024-02-08 talkingdev

论文:CLIP模型使用全合成数据进行训练

由于LAION等大规模数据集的删除,以及版权问题,使得训练大规模图像模型变得具有挑战性。但是,这项工作表明,使用3000万个全合成的图像可以训练出强大的CLIP模型。

Read More
2024-02-07 talkingdev

Nomic-Embed-Text-V1:全新文本嵌入模型的里程碑

Nomic-Embed-Text-V1是一种开源、完全可重现的文本嵌入模型,为短文本和长文本任务树立了新的标杆。在透明度方面独树一帜,Nomic-Embed-Text-V1提供完全访问其训练代码、模型权重和包含2.35亿个文本对的大型数据集的...

Read More
2024-02-06 talkingdev

AnimateLCM-高保真视频生成技术实现高质量视频创作

AnimateLCM是一种新的方法,可以通过将学习过程分成两部分来快速创建高质量的视频和改进现有的视频扩散模型。AnimateLCM的第一步是利用低复杂度的运动补偿技术来生成一个低质量的视频序列。 然后,利用一个基于自适...

Read More
2024-02-06 talkingdev

自然语言SQL-7B模型现身,强大的文本转SQL模型

最近,谷歌AI团队发布了一篇论文,介绍了他们新开发的自然语言SQL-7B模型。这一模型使用了一种名为T5的预训练语言模型。这种模型可以将人类语言转换为SQL查询。自然语言SQL-7B模型是目前最强大的文本转SQL模型之一,...

Read More
2024-02-05 talkingdev

Nous Research发布Hermes数据集

OpenHermes-2.5数据集已被用于训练一些最好的开源模型。该数据集包含100多万个高质量数据点的示例。现在已经发布。

Read More
2024-02-02 talkingdev

论文:文本为基础的图像修复技术发布

本文介绍了一个基于场景和手写文本的基准测试和两个数据集。利用原始、损坏和辅助图像,全局结构引导扩散模型(GSDM)利用文本结构有效恢复清晰文本。该技术在识别准确度和图像质量方面显示出显著的改进。

Read More
2024-02-02 talkingdev

Stanchion:SQLite3扩展程序,实现列式存储

Stanchion是一款SQLite 3扩展程序,可以在SQLite中实现列式存储。它将列式存储和数据仓库的所有优势带到了SQLite已经部署的任何地方。相对于行式存储,列式存储在存储和处理指标、日志和事件数据、时间序列数据存储...

Read More
2024-02-01 talkingdev

Lilac Garden快速聚类技术:将语言模型训练效率提高100倍

在训练语言模型时,一个挑战是为任务找到足够多样化的数据集。更难的是,将这些数据可视化。这个很酷的工具使用快速聚类和主题建模,使得可以探索数据,以改善过滤和整体质量。

Read More
2024-01-31 talkingdev

使用不一致掩模进行图像分割

不一致掩模(IM)是一种新的图像分割方法,即使只有有限的数据,也可以发挥作用。该方法在ISIC 2018数据集上进行了测试,击败了传统技术,甚至超过了在完全标记的数据集上训练的模型。

Read More
  1. Prev Page
  2. 14
  3. 15
  4. 16
  5. Next Page