漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-07-20 talkingdev

RepViT:高效的图像识别架构(GitHub Repo)

研究人员已经开发出一种新型的轻量级神经网络,名为RepViT。该网络通过整合轻量级视觉变换器(Vision Transformers)和传统的卷积神经网络(Convolutional Neural Networks)的高效设计元素而形成。这项技术的开发,...

Read More
2023-07-12 talkingdev

bitsandbytes发布4位推理,实现AI模型精度与速度的突破

AI模型包含许多参数,它们在计算机中以十进制数字的形式表示。这些数字的精度决定了它们的准确度和占用的空间大小。如果将精度从32位降低到16位,将会大幅提高运行速度。现在,我们可以将精度降低到4位,从而在一些...

Read More
2023-07-05 talkingdev

WavePaint模型:更快、更智能的图片修复工具

想象一下拥有一种可以快速准确地填补图片缺失部分的工具 - 这就是WavePaint模型所做的!它使用一种称为WaveMix的架构来修复图像,比当前的方法更快,步骤更少。

Read More
2023-06-21 talkingdev

新兴架构为LLM应用提供新机遇

这篇文章由a16z撰写,讨论了一些新兴的LLM应用架构,包括联邦学习、边缘计算和无服务器计算。这些架构为LLM提供了新的扩展方式和更高效的运行方式,可能会在未来推动LLM的广泛应用。

Read More
2023-05-31 talkingdev

用多模态语言模型生成图像

## 新闻内容: - 近来,多种数据类型的多模态训练变得越来越受欢迎。 - 模型架构通常需要复杂且有点脆弱的解决方案。 - Gill是一个很酷的新项目,它将文本标记与图像标记交错使用,从而实现真正的多模态输入和输出...

Read More
2023-05-25 talkingdev

Meta AI发布新AI模型Megabyte

Meta AI提出了一种新的AI模型架构,名为Megabyte,可以在多个格式上生成超过100万个标记。Megabyte解决了当前模型中的可扩展性问题,并并行执行计算,提高了效率并优于Transformers。 ## 核心要点: 以下是这篇新...

Read More
2023-05-24 talkingdev

RWKV模型:结合Transformer和循环神经网络的最佳文本处理工具

### 内容摘要: - Transformer已经取代循环神经网络成为大多数文本处理任务的主要工具。 - 由于架构的限制,这些Transformer很昂贵且上下文受限。 - RWKV是一种具有注意力变体的模型,它声称结合了Transformer和循...

Read More
2023-04-26 talkingdev

全稀疏融合技术提高3D物体检测效率

以下是本文的主要内容: - 本文研究了如何将图像模态整合到全稀疏架构中,以实现高效的远程3D检测。 - 该方法使用实例查询将2D实例分割与基于LiDAR的3D分割进行融合,从而实现了nuScenes和Argoverse 2数据集上的最...

Read More
  1. Prev Page
  2. 63
  3. 64
  4. 65
  5. Next Page