漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-06-12 talkingdev

LLM表现出惊人的人类特征

LLM是指语言模型,近来备受瞩目。它们是一种基于人工智能的算法,可以模拟人类的语言能力,甚至表现出惊人的人类特征。下面是该技术的三个核心点: - LLM可以模拟人类的语言能力,包括语法、语义和语用。 - LLM可以...

Read More
2023-06-12 talkingdev

新技术SpQR:高效LLM压缩技术

近日,研究人员提出了一种名为Sparse-Quantized Representation(SpQR)的新技术,可以实现对大型语言模型(LLMs)的几乎无损压缩,克服了量化带来的精度损失。这项技术使得强大的LLMs可以在像笔记本电脑和手机这样...

Read More
2023-06-09 talkingdev

深入理解GPT分词器

## 概述 本文讨论GPT分词器,这是大型语言模型用于将文本转换为预测所需的标记。我们介绍了一个Observable笔记本工具,它允许用户将文本转换为标记,反之亦然,并在完整的标记表中运行搜索。 ## 核心要点 - GPT分词...

Read More
2023-06-09 talkingdev

Cohere获得2.7亿美元C轮融资

内容摘要: - Cohere成功获得了大笔的融资,以继续开发其语言模型,并将其提供给产品组织。 - Cohere的语言模型可以帮助计算机更好地理解人类的语言和意图,从而提高自然语言处理的准确性。 - 此次融资将有助于Cohe...

Read More
2023-06-08 talkingdev

自我修复代码是软件开发的未来

内容概要: - 多家公司正在使用人工智能进行软件开发,大型语言模型可以通过自我反思提高其输出。 - 越来越多的研究表明,使用更有指导性的自回归方法来使用LLM可以带来更好的结果。 - LLM的快速生成大量代码的能力...

Read More
2023-06-08 talkingdev

CodeTF库发布,助力代码智能化

## 新闻内容: GitHub开源社区发布了一款名为CodeTF的Python Transformer库,致力于提高代码智能化的水平,为使用者提供了一个训练与推理的平台,可以轻松实现代码智能化任务,如代码摘要、翻译、生成等。 CodeTF...

Read More
2023-06-07 talkingdev

GGML推出,以纯C语言框架降低本地运行成本

GGML以纯C语言编写的框架,让用户可以在MacBook电脑上轻松运行大型语言模型,这种模型通常在本地运行成本较高。目前,这一框架主要被业余爱好者使用,但在企业模型部署方面也有广泛的应用前景。 核心要点: - GGML...

Read More
2023-06-07 talkingdev

近1000亿多语言法律语料库

近日,一个包含24种语言的大型法律文件语料库到来。同时,已提供训练模型和训练代码。他们发现,在这个689GB的语料库上训练的模型可以实现法律语言模型的最新技术水平。 ## 新闻内容: 以下是该新闻的三个核心要点...

Read More
  1. Prev Page
  2. 121
  3. 122
  4. 123
  5. Next Page