漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-06 talkingdev

16亿参数模型在人类评估中取得32%的成绩

这是一个全新的、闪电般快速的代码生成模型。该模型是从零开始,基于1.2万亿个半代码半语言数据进行训练的。这一模型的出现,将为人工智能模型开发带来革新。通过大规模的参数训练,该模型已经在人类评估(HumanEval...

Read More
2023-09-06 talkingdev

论文:提升数学技能的研究新突破

这项研究探讨了大型语言模型(LLMs)解决数学问题的能力,及各种不同因素如何影响它们的能力。研究人员发现,一种名为“拒绝采样精细调整”(Rejection sampling Fine-Tuning, RFT)的方法有助于这些模型在数学上的提...

Read More
2023-09-06 talkingdev

论文:强化零样本模型的微调技术

零样本模型是人工智能模型中的一种,他们在广泛的分布上都有着强大的性能。但是,如果你在特定的狭窄任务上对它们进行调整,它们可能会在提高特定任务性能的同时,失去原本的广泛适应性。这个现象虽然有其积极的一面...

Read More
2023-09-06 talkingdev

SQLdepth-智能驾驶与机器人的全新视觉工具

近日,一群研究者已经开发出一种名为SQLdepth的全新工具,有助于自动驾驶汽车和机器人更加详细地理解他们所处的环境。这款工具的创新之处在于,它能够有效地提取周围环境的信息,进而生成一个详细的三维模型,实现对...

Read More
2023-09-06 talkingdev

BLoRA开源,同一GPU上批量处理LoRAs

LoRAs是一种小型的参数适配器,通过插入到某些层次来改变底层模型的行为。你可以为基础模型进行批量生成,以提高性能。此外,你还可以对LoRA修改后的模型进行批量处理,并向不同的用户提供具有不同性能的模型。这种...

Read More
2023-09-06 talkingdev

Hugging Face推出新服务:一键训练模型,无需处理复杂内部过程

近日,人工智能科技公司Hugging Face发布了一项新的服务,该服务使得用户无需处理复杂的内部过程,仅需一键,即可对模型进行训练。这项创新型服务意味着,用户可以省去在深度学习项目中进行模型训练时,所需投入的大...

Read More
2023-09-06 talkingdev

X公司确证将利用公开数据训练其AI模型

X公司近日更新了其隐私政策,将从用户那里收集生物识别、工作以及教育信息。值得注意的是,X公司将利用这些数据和其他公开信息来训练其AI模型。亚历克斯·伊万诺夫(Alex Ivanovs)提出,埃隆·马斯克可能会利用X公司的...

Read More
2023-09-05 talkingdev

神经网络识别香气:新模型可以用于数字化气味

研究人员使用一种称为图形神经网络的深度学习算法创建了一个模型,将化学结构映射到气味描述符。该模型可以成功预测人类如何描述新的气味,并有可能用于数字化气味。本项目的主要气味图是开源的,文章中提供了该项目...

Read More
  1. Prev Page
  2. 370
  3. 371
  4. 372
  5. Next Page