漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-04-19 talkingdev

LLaVA:大规模语言和视觉助手

新闻内容: LLaVA是一种新型的大规模语言和视觉助手,它可以帮助人们更好地理解和处理自然语言和视觉数据。下面是LLaVA的三个核心要点: - LLaVA可以处理大规模的自然语言和视觉数据,从而帮助人们更好地理解和利...

Read More
2023-04-19 talkingdev

Vercel Labs推出AI Playground

新闻内容: - Vercel Labs发布了AI Playground,一个让开发者快速构建和训练AI模型的平台。 - AI Playground集成了最新的机器学习框架和自然语言处理技术,让开发者可以轻松地构建各种类型的AI应用。 - 该平台还提供...

Read More
2023-04-18 talkingdev

一分钟读懂:Cerebras-GPT:利用开放式计算实现高效可扩展的语言模型

以下是新闻主要内容: - Cerebras-GPT是一种计算优化的语言模型系列,通过利用高效的预训练、扩展和最大更新参数化,展示了先进的预训练和下游目标的训练效率。 - 作为第一个比较计算优化的模型扩展的开放和可重现...

Read More
2023-04-18 talkingdev

GPT-4指令调整实现突破性进展

以下为新闻内容的主要要点: - 研究人员利用GPT-4生成的指令跟踪数据进行LLaMA微调,实现了在英语和中文两种语言中新任务的零-shot表现优于之前的最先进模型。 - 该突破性进展伴随着全面的评估和奖励模型训练,数据...

Read More
2023-04-18 talkingdev

Multimodal C4:一个开放的、具有十亿级图像的文本语料库

以下是本新闻的三个核心要点: - Multimodal C4(mmc4)是一个公开可用的数据集,它将纯文本的c4语料库与交错的图像相结合,支持像Flamingo这样的上下文视觉和语言模型。该数据集使用带有CLIP特征的线性分配算法创...

Read More
2023-04-16 talkingdev

OpenAssistant Conversations – 实现大型语言模型对齐的民主化[pdf]

新闻内容: OpenAI发表了一篇名为“OpenAssistant Conversations”的新论文,该论文探讨了使用大型语言模型来对齐对话的方法。这项技术可以帮助开发人员更轻松地构建聊天机器人和其他自然语言处理应用程序。以下是该...

Read More
2023-04-16 talkingdev

Web LLM - 利用WebGPU推动的大型语言模型推理

新闻内容: - Web LLM是一种基于WebGPU技术的大型语言模型推理方法 - 该技术可提高大型语言模型的推理速度和效率 - Web LLM有望应用于自然语言处理、机器翻译等领域,为人工智能技术的应用提供更为便利的解决方案

Read More
2023-04-16 talkingdev

打破记录!1T参数模型将使用33TB文本数据进行训练

新闻内容: - 研究人员正在使用33TB的文本数据训练一个1T参数模型,这是迄今为止最大的模型之一。 - 这个模型将用于自然语言处理,如语义理解和机器翻译,以提高模型的准确性和语义理解能力。 - 这项工作突破了以前...

Read More
  1. Prev Page
  2. 49
  3. 50
  4. 51
  5. Next Page