漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-21 talkingdev

论文:让大型语言模型在医学上发挥更大作用

这项研究的重点是使已经擅长理解和生成文本的大型语言模型,在回答医学问题方面表现得更好。大型语言模型(LLMs)已经在很多领域包括医学领域显示出了巨大的潜力,然而,尽管如此,它们在理解和回答具体的医学问题方...

Read More
2023-09-19 talkingdev

论文:新型语言模型目标采用捆绑嵌入加速训练

通常情况下,语言模型的输入和输出嵌入层是捆绑在一起的。然而,如果您将输入嵌入与模型内部的其他嵌入捆绑在一起,并使用对比损失,您可以在实际运行时间和最终基准准确度上获得显著改善的性能。这种方法的关键在于...

Read More
2023-09-14 talkingdev

AnomalyGPT:专注在工业领域的异常检测新模型

尽管像MiniGPT-4这样的大型模型在理解图像方面表现出色,但它们在处理工业环境中的详细异常方面却存在困难。而新型解决方案AnomalyGPT,通过对模拟异常图像及其描述进行训练,可以检测出工业故障,无需手动调整。这...

Read More
2023-09-12 talkingdev

为什么Nvidia在人工智能领域的霸主地位只是暂时的

Nvidia在人工智能领域的领先地位远非稳固。它目前的优势主要是因为几乎没有人在运行大型机器学习应用程序,竞争对手还没有成熟,研究人员拥有购买力,以及关注于模型训练方面。但在不久的将来,使用CPU进行推理将会...

Read More
2023-09-07 talkingdev

苹果每天投入“数百万美元”开发对话式人工智能,旨在大幅改进Siri

据报道,苹果正在投入数百万美元的人工智能产品研究,旨在创建一款能够自动化涉及多个步骤的任务的Siri。大部分预算都用于模型训练,这需要大量昂贵的硬件。该公司已经研究了四年的大型语言模型,但尚不清楚它在多年...

Read More
2023-09-06 talkingdev

16亿参数模型在人类评估中取得32%的成绩

这是一个全新的、闪电般快速的代码生成模型。该模型是从零开始,基于1.2万亿个半代码半语言数据进行训练的。这一模型的出现,将为人工智能模型开发带来革新。通过大规模的参数训练,该模型已经在人类评估(HumanEval...

Read More
2023-09-06 talkingdev

Hugging Face推出新服务:一键训练模型,无需处理复杂内部过程

近日,人工智能科技公司Hugging Face发布了一项新的服务,该服务使得用户无需处理复杂的内部过程,仅需一键,即可对模型进行训练。这项创新型服务意味着,用户可以省去在深度学习项目中进行模型训练时,所需投入的大...

Read More
2023-09-05 talkingdev

Tiny Llama开源:1.1B参数模型训练

小型羊驼(Tiny Llama)项目旨在为3T代币训练出一个参数为11亿的羊驼2(Llama2)模型。根据扩展规律,这对于计算优化来说无疑是严重的过度训练,但它对于部署优化带来了显著的收益。此次的模型训练打破了传统的优化...

Read More
2023-09-04 talkingdev

modular-diffusion:一种使用PyTorch设计和训练自定义扩散模型的简单API

模块化扩散是一种易于使用的模块化API,可用于设计和训练自定义扩散模型。这款API基于PyTorch构建,为用户提供了一种灵活的方式,可根据需要进行定制和优化,从而实现在各种需求场景下的模型训练。由于其模块化的设...

Read More
2023-08-29 talkingdev

Prompt2Model:一种自然语言任务描述的小型专用模型训练系统

Prompt2Model是一种新颖的系统,它通过自然语言任务描述来训练一个小型的专用模型,非常适合于部署。这种系统的出现,使得模型训练过程更加人性化,用户只需要用自然语言描述任务,系统就可以根据描述内容进行训练。...

Read More
  1. Prev Page
  2. 9
  3. 10
  4. 11
  5. Next Page