AR的相关内容 - 漫话开发者

2024-01-16 talkingdev

从人工狭义智能到通用智能：探讨融合人机的超级智能路径

一位人类认知和人工智能专家探讨了从人工狭义智能到通用智能的演变，提出通过融合人机的方式或许是通向超级智能的潜在路径。在过去的几十年中，人工智能已经取得了长足的进步，但是它的发展仍受到许多限制。人工狭义...

2024-01-16 talkingdev

Dreambooth是目前最好的个性化图像模型的方法。Prompt对齐技术显著提高了对Prompt的遵循度，并且具有组合性。

2024-01-16 talkingdev

AnimateAnyone 是一款非常优秀的视频控制模型，它接受图像和骨架动作作为输入，然后将人物动画应用到控制图像上。这个开源仓库是对这项工作的复现，它实现了 AnimateAnyone 的主要功能，并在开发者社区中广受好评。

2024-01-16 talkingdev

最近，一位技术爱好者开发了一个名为AutoNarrate的GitHub Repo，它使用GPT4-V和最先进的文本转语音技术，加上一些屏幕录制软件，可以让像David Attenborough这样的人自动记录你生活中的所有事情。该技术可用于个人日...

2024-01-16 talkingdev

排线检测是在图像或PDF中在文本行周围放置一个边界框的过程。Surya是一个非常强大的多语言排线检测模型，并已在GitHub上开源发布。该模型可以识别多种语言，包括中文、英文、法文、德文和印地文等，并且可以在不同的...

2024-01-16 talkingdev

Anthropic发布了一项非常有趣的研究，该研究有意将语言模型中的“睡眠短语”进行有害污染。研究发现，它无法将这种模型与用于生产模型的强大系统进行“对齐”。也就是说，一旦模型被污染，就无法使用当前的工具消除不良...

2024-01-16 talkingdev

PixArt一直是流行的Stable Diffusion图像生成模型的并行研究方向。本研究采用潜在一致性模型实现更快的生成速度，并采用ControlNet样式提示实现更好的控制。

2024-01-16 talkingdev

自我指涉语句是一种挑战，例如“这个句子中的最后一个单词是is”。语言模型在处理这种语言时会遇到极大的困难。该论文介绍了一个数据集以及一些评估，以帮助改进语言模型的元语言能力。研究人员采用了一种混合方法来生...