训练数据的相关内容 - 漫话开发者

2024-04-10 talkingdev

使用Colab在H100上训练超过20万上下文窗口的新梯度累积卸载技术

Longcontext Alpaca训练技术最近取得了重大突破，通过在H100硬件上使用新的梯度累积卸载技术，成功训练了超过200,000个上下文窗口。这种创新方法使得大规模深度学习模型的训练变得更加高效，显著提高了计算资源的利...

2024-04-09 talkingdev

当前神经网络在超出其训练数据的情况下泛化能力有限，这限制了它们的推理和可靠性。为了实现人工通用智能（AGI），我们需要寻找替代方法。专家认为，尽管深度学习和神经网络在特定任务上取得了显著成就，但它们距离...

2024-04-08 talkingdev

近期，科技巨头们在人工智能领域领跑的比赛中采取了一些颇具争议性的数据获取方式。OpenAI通过开发名为Whisper的语音识别工具，成功从YouTube视频中转录音频，为训练其AI系统提供了新文本。该团队最终转录了超过一百...

2024-03-20 talkingdev

近日，一项名为Poster Dataset Distillation的技术引起了广泛关注。该技术能够将庞大的数据集压缩成一个单一的'海报'，使得人工智能模型能够通过不到一张每个类别的图片进行学习。这一创新方法大幅减少了训练AI模型...

2024-03-11 talkingdev

来自不同厂商的四款新模型正在挑战GPT-4长期以来的顶尖大型语言模型的地位，展示了能力和应用方面的不断进步，但它们都没有公开许可证或透明地公开其训练数据。

2024-03-04 talkingdev

Bonito是一种开源模型，旨在将未注释的文本转换为定制的训练数据集，从而增强大型语言模型对专业任务的适应性，而不需要预先存在的注释。

2024-02-27 talkingdev

谷歌承认其AI模型Gemini存在问题。该模型会向历史图像中注入不适当的多样性，反映出训练数据中存在偏见的问题。这个缺陷引发了有关科技领域中多样性、公平性和包容性的讨论。谷歌暗示将来会做出改进，但没有就AI在生...

2024-02-22 talkingdev

根据OpenAI平台上的新文档，GPT-4模型的训练数据已更新，包括了截止于2023年12月的信息。GPT-4是一种自然语言处理模型，它可以生成人类能够理解的语言。这一更新表明，GPT-4将有更多的信息可用于训练，以更好地理解...