漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-07-08 talkingdev

DragonDiffusion:一种采用特征对应提高文本到图像编辑精度的新方法

DragonDiffusion是一种全新的方法,旨在提高文本到图像模型的编辑精度。通过在扩散模型中利用特征对应,DragonDiffusion可以进行各种详细的图像修改,如移动和调整对象的大小,替换外观,以及拖动内容,同时保持图像...

Read More
2023-07-05 talkingdev

基于代码的计算机视觉研究平台(GitHub代码库)

Scenic是一个以注意力为核心的计算机视觉研究代码库。

Read More
2023-06-30 talkingdev

a16z:未来计算机从工具到伙伴的范式转变

a16z详细阐述了计算机的未来以及从工具到伙伴的范式转变。该文章介绍了人工智能的未来可能发展方向。

Read More
2023-06-30 talkingdev

InflectionAI融资13亿美元,成立仅一年

Inflection是一家成立仅一年的初创公司,由DeepMind前联合创始人和应用AI负责人创立,该公司获得了大量资金。该公司提供一款名为Pi的个性化AI助手。此次宣布的融资消息是在Inflection最近构建的Nvidia + CoreWeave超...

Read More
2023-06-26 talkingdev

AI生成图像的单一图像编辑方案:解开图像编辑的离散化之道

学习离散化表示是计算机视觉领域的一个令人兴奋的研究领域。像CLIP这样的大规模对比方法一度让离散化研究失去了市场。然而,现在,借助开源扩散模型,我们可以利用文本标记的力量来解开图像中的对象,实现对AI生成图...

Read More
2023-06-26 talkingdev

TIMM计算机视觉工具套件

TIMM中有许多顶级计算机视觉模型,但在处理生产系统时,通常需要更多。OpenMMlab提供了一套高质量的系统,用于各种视觉任务,如姿态和分割。

Read More
2023-06-21 talkingdev

LOMO:高效的LLM训练(GitHub开源)

这项研究介绍了LOw-Memory Optimization(LOMO),这是一种旨在显著减少大型语言模型(LLM)训练所需资源的优化器,目前这一过程需要大量的GPU资源。LOMO的创新方法使得只需使用一台具有8个RTX 3090 GPU(每个具有24...

Read More
2023-06-19 talkingdev

以低廉的价格运行A100

Nvidia A100是市场上最强大的GPU之一。它们已被用于训练迄今为止最流行的模型之一。它们是数据中心的GPU,通常意味着您无法在自己的硬件上运行它们。本文探讨了如何以几千美元的价格自己组装一个本地运行的A100超级...

Read More
  1. Prev Page
  2. 53
  3. 54
  4. 55
  5. Next Page