漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-03 talkingdev

视频模型高效训练,仅需一台机器和八个标准GPU

训练优秀的视频模型通常需要巨大的资源,这种需求往往超出了学术界的承受范围。现在,研究人员已经找到了一种方法,只需要使用一台配备八个标准GPU的机器,在一天内就能完成这些模型的训练。这意味着,我们不再需要...

Read More
2023-09-29 talkingdev

联合训练大型多模态模型:一种新的算法取得了突破

模型通常针对特定任务(例如,语言生成和图像生成)进行单独训练。然而,最近提出的一种名为联合自回归混合(JAM)的算法,通过巧妙地交叉注意力和温和的微调,成功地将不同的模型结合在一起。这种新颖的方法在多种...

Read More
2023-09-26 talkingdev

LayoutLM:提升商业文件阅读效率的新模型

LayoutLM是一个擅长阅读商业文件的模型,现在它变得更聪明了。该模型通过两种新的训练方式进行改进,一种是帮助它理解复杂的布局,另一种是获取正确的数值。LayoutLM的出现,让我们可以更有效地处理和理解商业文件,...

Read More
2023-09-25 talkingdev

一项新的研究结果对语言模型的理解产生了挑战

语言模型在训练过程中,通常会遇到一种情况,即当模型训练的内容是“A是B”时,它并不能自动推断出“B是A”。这一发现对当前的语言模型(LLMs)提出了挑战和质疑,因为我们通常会期待模型能够自动推断出这样的逻辑关系。...

Read More
2023-09-21 talkingdev

论文:让大型语言模型在医学上发挥更大作用

这项研究的重点是使已经擅长理解和生成文本的大型语言模型,在回答医学问题方面表现得更好。大型语言模型(LLMs)已经在很多领域包括医学领域显示出了巨大的潜力,然而,尽管如此,它们在理解和回答具体的医学问题方...

Read More
2023-09-19 talkingdev

论文:新型语言模型目标采用捆绑嵌入加速训练

通常情况下,语言模型的输入和输出嵌入层是捆绑在一起的。然而,如果您将输入嵌入与模型内部的其他嵌入捆绑在一起,并使用对比损失,您可以在实际运行时间和最终基准准确度上获得显著改善的性能。这种方法的关键在于...

Read More
2023-09-14 talkingdev

AnomalyGPT:专注在工业领域的异常检测新模型

尽管像MiniGPT-4这样的大型模型在理解图像方面表现出色,但它们在处理工业环境中的详细异常方面却存在困难。而新型解决方案AnomalyGPT,通过对模拟异常图像及其描述进行训练,可以检测出工业故障,无需手动调整。这...

Read More
2023-09-12 talkingdev

为什么Nvidia在人工智能领域的霸主地位只是暂时的

Nvidia在人工智能领域的领先地位远非稳固。它目前的优势主要是因为几乎没有人在运行大型机器学习应用程序,竞争对手还没有成熟,研究人员拥有购买力,以及关注于模型训练方面。但在不久的将来,使用CPU进行推理将会...

Read More
  1. Prev Page
  2. 15
  3. 16
  4. 17
  5. Next Page