漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-02-15 talkingdev

将代码库转换为单一Markdown文档,助力AI模型训练

近日,一项创新技术引起了开发者社区的广泛关注。该技术能够将整个代码库转换为单一的Markdown文档,从而方便地将其输入到AI模型中进行训练和分析。通过这种方式,开发者可以更高效地利用AI工具来理解和优化代码结构...

Read More
2025-02-04 talkingdev

DeepSeek AI模型颠覆市场,创新或重塑AI竞争格局

DeepSeek的AI模型以其显著低于其他领先模型的训练成本,正在颠覆AI市场。这一突破性进展不仅挑战了Nvidia等科技巨头的地位,还展示了资源高效利用的潜力。传统观念认为,更高的投入意味着更好的性能,但DeepSeek的成...

Read More
2024-05-01 talkingdev

Nvidia推出CUDA-checkpoint工具包:助力分布式训练大型AI模型

Nvidia最近发布了一个新的工具包,可以对CUDA状态进行检查点设置,以便于传输和重启。这一工具包在GitHub上公开,对于大型AI模型的分布式训练非常有用。CUDA状态的检查点设置可以在训练过程中保存模型的状态,以便在...

Read More
2024-04-10 talkingdev

使用Colab在H100上训练超过20万上下文窗口的新梯度累积卸载技术

Longcontext Alpaca训练技术最近取得了重大突破,通过在H100硬件上使用新的梯度累积卸载技术,成功训练了超过200,000个上下文窗口。这种创新方法使得大规模深度学习模型的训练变得更加高效,显著提高了计算资源的利...

Read More
2024-03-20 talkingdev

全新数据压缩技术:AI模型训练数据集大幅缩减

近日,一项名为Poster Dataset Distillation的技术引起了广泛关注。该技术能够将庞大的数据集压缩成一个单一的'海报',使得人工智能模型能够通过不到一张每个类别的图片进行学习。这一创新方法大幅减少了训练AI模型...

Read More
2024-02-28 talkingdev

旧金山计算公司推出全球最便宜的H100训练集群

旧金山计算公司(SF Compute)现在推出了全球最便宜的H100训练集群,并提供灵活的短期租赁选项,针对需要进行AI模型训练的客户,而无需长期承诺。其第一个集群Angel Island已经上线,另一个Bay Bridge即将推出。SF C...

Read More
2023-12-15 talkingdev

OpenAI与Axel Springer签署许可协议,用新闻内容训练AI模型

OpenAI与柏林出版商Axel Springer达成协议,将使用该出版商的内容来训练其生成式AI模型,并将最近由Axel Springer发布的文章添加到ChatGPT中。这项协议将使OpenAI的AI模型能够更好地理解新闻内容和语言,从而提高其...

Read More
2023-10-25 talkingdev

艺术家的武器!数据污染工具让艺术家对抗生成式AI

芝加哥大学的研究人员开发了一种工具,让艺术家可以给他们的艺术作品添加不可见的变化,这会导致AI模型训练失败。这个工具旨在防止AI公司未经许可使用艺术家的作品。这个叫Nightshade的工具将被集成到Glaze中,Glaze...

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3
  5. Next Page