漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-05-16 talkingdev

用激活向量控制语言模型生成

近期,一篇名为《用激活向量控制语言模型生成》的论文备受关注。这篇论文提出了一种新的方法,可以通过添加激活向量来控制语言模型的生成方向,从而实现对生成结果的引导,这对于AI安全领域的发展具有重要的意义。以...

Read More
2023-05-13 talkingdev

Anthropic模型升级:100k上下文标记突破

Anthropic最新消息,其Claude模型现已可处理更长上下文标记。这意味着,您的组织可以将完整文档输入模型,语言模型将会对其进行操作。他们举了一个例子,将240页编码文档输入Claude,并让其回答编码问题。目前尚未公...

Read More
2023-05-11 talkingdev

LLM技术为个人用户带来的优势

近年来,大型语言模型(LLM)技术的崛起为个人用户带来了诸多优势。以下是本文的核心内容: - LLM技术可以帮助创意写作,生成代码和回答各种问题。 - 但是,LLM技术也存在一些潜在的缺陷,如人工智能生成的错误信息...

Read More
2023-05-11 talkingdev

利用大型语言模型构建经济实惠的企业

新闻内容: - 大型语言模型(LLMs)如GPT-3.5-turbo的应用可以成为自动化任务或生成内容的经济实惠解决方案。 - 相比于人力劳动,LLMs可以以低至0.08美元的价格生成足够吸引用户一小时的文本,因此在许多任务中更加经...

Read More
2023-05-11 talkingdev

LLM Chain 项目发布至 GitHub Repo

LLM Chain 是一个强大的 Rust crate,可用于构建大型语言模型中的链式结构,从而使您能够对文本进行摘要和完成复杂任务。 ## 项目亮点 LLM Chain 提供了许多优秀的功能,如: - 构建链式结构,使你可以对大量的文...

Read More
2023-05-11 talkingdev

GitHub仓库Chain-Of-Thought-Hub测试大型语言模型的复杂推理能力

### 核心要点: - GitHub仓库Chain-Of-Thought-Hub旨在通过链式思考提示来测试大型语言模型的复杂推理能力。 - 该仓库提供了一系列链式思考提示,旨在测试模型在推理和推断方面的表现。 - 这些测试可以帮助研究人员...

Read More
2023-05-10 talkingdev

人工智能语言模型Claude采用宪法AI方法进行训练

Anthropic公司采用宪法AI方法对其语言模型Claude进行训练,为其赋予了明确的价值观。这些价值观是根据一系列宪法原则确定的,包括联合国人权宣言等,而不是像RLHF输入那样由隐含的价值观决定。 ## 主要内容: - An...

Read More
2023-05-09 talkingdev

百万美元AI微调挑战赛

**内容简介:** - Kaggle的微调语言模型类比赛 - 通过社区的协力,提高语言模型的安全性 - 提供计算资源合作和奖励机制 - 比赛将于6月10日开始 **核心要点:** - Kaggle平台为微调语言模型提供了竞赛机会 - 通过...

Read More
  1. Prev Page
  2. 162
  3. 163
  4. 164
  5. Next Page