漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-05 talkingdev

SpeechTokenizer,语音模型的统一语音分词器

研究人员创造了一个名为SpeechTokenizer的工具,该工具通过使用一种混合不同语音方面的特殊架构,帮助模型以更有效的方式理解口语。通过这种方式,它尝试解决语音模型在理解和处理口语时面临的挑战。它的创新之处在...

Read More
2023-09-05 talkingdev

论文:智能学习新系统,不间断地掌握多项任务

本文提出了一种新的系统,该系统可帮助模型在学习新任务的同时,不会忘记旧的任务。这是一种前沿的深度学习技术,主要解决了模型在学习新任务时往往会忘记旧任务的问题,这个问题在AI领域被称为灾难性遗忘。通过这种...

Read More
2023-09-05 talkingdev

Tiny Llama开源:1.1B参数模型训练

小型羊驼(Tiny Llama)项目旨在为3T代币训练出一个参数为11亿的羊驼2(Llama2)模型。根据扩展规律,这对于计算优化来说无疑是严重的过度训练,但它对于部署优化带来了显著的收益。此次的模型训练打破了传统的优化...

Read More
2023-09-05 talkingdev

ragas:助力评估检索增强生成管道的框架

ragas是一个框架,它可以帮助你评估你的检索增强生成(Retrieval Augmented Generation,简称RAG)管道,这是一类使用外部数据来增强LLM(语言模型学习)上下文的应用程序。RAG管道是近年来人工智能领域的重要研究方...

Read More
2023-09-05 talkingdev

LLM微调Hub:专为使用场景优化的大型语言模型

LLM微调中心是一个包含代码和洞察的平台,专门用于微调各种大型语言模型以适应您的使用场景。不论您是开发者,还是研究人员,甚至是业务决策者,都可以在此找到有用的资源。通过微调,大型语言模型的性能可以得到显...

Read More
2023-09-04 talkingdev

深入解析Postgres Meme

这篇文章分析了SQL Iceberg梗图,该图展示了日益复杂或先进的SQL命令或操作。文章逐个解释了每个“区域”的概念,从简单的命令如CREATE TABLE、JOIN和NULL开始,到中级和高级主题,如连接池、去规范化、火山模型和万圣...

Read More
2023-09-04 talkingdev

X公司将利用公开数据训练AI模型

X公司计划利用其收集的信息以及其他公开可用的信息来帮助训练其机器学习和AI模型。这个决定将大大提升AI模型的学习能力和处理复杂任务的能力。公开数据的利用将为模型的训练提供更丰富的素材,使得AI模型可以更好地...

Read More
2023-09-04 talkingdev

RLHF与RLAIF的首次公开比较:性能相当,受人类青睐

近日,研究人员第一次公开比较了RLHF和RLAIF两种技术的性能。结果发现,这两种技术在最终模型性能方面基本相同,相比于基线模型,有大约70%的人类用户更青睐使用这两种技术。RLHF和RLAIF的研究和开发,推动了人工智...

Read More
  1. Prev Page
  2. 371
  3. 372
  4. 373
  5. Next Page