AR的相关内容 - 漫话开发者

2024-01-20 talkingdev

前Twitter CEO Parag Agrawal创立AI初创公司

前Twitter CTO兼临时CEO Parag Agrawal创立了自己的AI初创公司，该公司已经获得了来自Khosla Ventures等知名风险投资公司的资助。

2024-01-20 talkingdev

TACO是一个新的基准，用于评估系统生成代码的能力。它比现有数据集大得多，包含更具挑战性的问题。在简单的问题上，GPT-4的正确率达到30％，而在最难的问题子集上，它仅能达到2％。

2024-01-20 talkingdev

Dolphin被广泛认为是可用性最强的未经审查的开放模型之一。它主要建立在Mixtral上。这个120B的模型是通过合并两个较小的Dolphin模型而制成的。研究发现，与Goliath 120B一起使用这种合并过程可以提高整体模型性能。

2024-01-20 talkingdev

近日，一款名为Instance Segmentation for Novel Objects的GitHub开源项目备受关注。该项目旨在评估深度学习模型在实例分割方面对新物体的泛化能力。通过该项目，用户可以训练自己的实例分割模型，并对模型进行评估...

2024-01-20 talkingdev

Compose and Conquer公司推出了一种条件扩散模型，该模型在生成的图像中的三维空间中放置物体方面表现出色。该模型可用于生成逼真的图像，例如虚拟世界中的景观和人物。条件扩散模型的优点在于其可以对图像进行分层...

2024-01-20 talkingdev

近日，AI系统Vlogger在GitHub上推出了自己的仓库，为用户提供分钟级别的视频博客制作服务。Vlogger的制作流程分为四个阶段：脚本、演员、节目制作和配音，每个阶段都代表着视频制作的不同方面。用户只需要向Vlogger...

2024-01-20 talkingdev

一项新的研究通过解决图像编辑中存在的挑战，例如不明确的指令和识别需要修改的图像部分，大幅提高了使用自然语言指令编辑图像的效率。该研究使用了深度学习和自然语言处理技术，将自然语言指令转换为可执行的图像编...

2024-01-20 talkingdev

苹果公司发布了一篇关于用自回归损失预训练图像模型的论文。它测量了扩展行为，并发现像语言一样，这些大规模无监督的图像模型具有非常可预测的行为。这项技术为图像识别和计算机视觉领域的研究提供了新的思路和方法...