模型开发的相关内容 - 漫话开发者

2023-09-06 talkingdev

16亿参数模型在人类评估中取得32%的成绩

这是一个全新的、闪电般快速的代码生成模型。该模型是从零开始，基于1.2万亿个半代码半语言数据进行训练的。这一模型的出现，将为人工智能模型开发带来革新。通过大规模的参数训练，该模型已经在人类评估（HumanEval...

2023-08-18 talkingdev

DeepEval 是一个提供 Pythonic 方式进行离线评估的工具，可以帮助您方便地将 LLM 流水线投入生产。LLM 流水线是一种机器学习模型开发流程，通过使用 DeepEval，开发者可以在不连接网络的情况下，对其进行评估和优化...

2023-06-07 talkingdev

## 新闻概要： - RedPajama数据集与部分训练模型已于几周前发布。 - 7B模型在3000台V100上刚刚完成训练。 - 经过调整的版本是其规模中最有效的开放模型之一。 - 团队有很多关于持续模型开发的计划。 ## 新闻内容：...

2023-06-01 talkingdev

近日，BabyLM挑战赛成为了一项旨在开发更小但仍然有效的人工智能模型的举措。由于大型LLM模型的缺点，如更大的模型需要处理能力，而只有少数公司拥有这种能力，因此推动开发更小的AI模型已经成为了当前的趋势。 ###...

2023-05-08 talkingdev

近日，NBC News发表文章，深入探讨了OpenAI的ChatGPT背后的影子劳动力的角色。这个劳动力由承包商组成，负责完善和维护AI系统。文章揭示了开发和运作像ChatGPT这样的AI模型所涉及的人力成本，承包商审查和评价潜在的...