漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-06 talkingdev

16亿参数模型在人类评估中取得32%的成绩

这是一个全新的、闪电般快速的代码生成模型。该模型是从零开始,基于1.2万亿个半代码半语言数据进行训练的。这一模型的出现,将为人工智能模型开发带来革新。通过大规模的参数训练,该模型已经在人类评估(HumanEval...

Read More
2023-08-18 talkingdev

DeepEval:为您的LLM流水线提供离线评估

DeepEval 是一个提供 Pythonic 方式进行离线评估的工具,可以帮助您方便地将 LLM 流水线投入生产。LLM 流水线是一种机器学习模型开发流程,通过使用 DeepEval,开发者可以在不连接网络的情况下,对其进行评估和优化...

Read More
2023-06-07 talkingdev

RedPajama 7B模型完成训练

## 新闻概要: - RedPajama数据集与部分训练模型已于几周前发布。 - 7B模型在3000台V100上刚刚完成训练。 - 经过调整的版本是其规模中最有效的开放模型之一。 - 团队有很多关于持续模型开发的计划。 ## 新闻内容:...

Read More
2023-06-01 talkingdev

竞相研发更小的人工智能

近日,BabyLM挑战赛成为了一项旨在开发更小但仍然有效的人工智能模型的举措。由于大型LLM模型的缺点,如更大的模型需要处理能力,而只有少数公司拥有这种能力,因此推动开发更小的AI模型已经成为了当前的趋势。 ###...

Read More
2023-05-08 talkingdev

涉及ChatGPT的承包商每小时赚取15美元

近日,NBC News发表文章,深入探讨了OpenAI的ChatGPT背后的影子劳动力的角色。这个劳动力由承包商组成,负责完善和维护AI系统。文章揭示了开发和运作像ChatGPT这样的AI模型所涉及的人力成本,承包商审查和评价潜在的...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4