新方法的相关内容 - 漫话开发者

2023-09-28 talkingdev

Llava-RLHF视觉对齐模型的全新技术突破

Llava是一种将视觉能力插入语言模型的方法。现在，它已经通过指令调整，并运行了RLHF（强化学习和直觉推理）过程。Llava大大提高了指令遵循和推理能力。这种新方法将人工智能技术推向了一个新的高度，使得计算机不仅...

2023-09-27 talkingdev

目前，大多数语义图像编辑工具在将新对象平滑地融入场景中时面临困扰。这种新方法通过智能理解全景和部分隐藏的对象，改善了这一问题。语义图像编辑是一种基于图像含义进行更改的技术，其核心在于理解图像的内容并对...

2023-09-27 talkingdev

神经辐射场(NeRF)在创建虚拟视图方面表现出色，但对于光滑或透明的物体则力不从心。一种新的方法，被称为折射-反射场，通过更好地处理光变化和产生更清晰的复杂物体图像，解决了这个问题。这一新技术的采用，将极大...

2023-09-22 talkingdev

这项研究探讨了如何使'学生'网络（较小的模型）在从未遇到过的情况下，更好地从'教师'网络（较大的模型）中学习。研究介绍了一种名为权重平均知识蒸馏（WAKD）的新方法，该方法的效果与现有技术一样好，但使用更为简...

2023-09-21 talkingdev

丰田研究所(TRI)正在展示其在研究进展中如何在一夜之间教授机器人新技能。TRI运用传统的机器人学习技术和类似于生成AI模型的扩散模型。其系统已经针对60种技能进行了训练，主要关注在不同环境中的多功能性，目标是制...

2023-09-20 talkingdev

从单一的2D图像中确定3D深度是一项棘手的任务，因为许多3D场景在2D中看起来可能相同。这种方法将相机的细节与图片的内容进行了分离，使得在各种情况下更容易猜测深度。这种深度估计的灵活性可以在各种复杂环境下，如...

2023-09-20 talkingdev

将长篇文字转化为图像一直是一项艰巨的任务，尤其当需要展示的项目或细节众多时。然而，一种新的方法打破了这个困扰。这种新的方法将长篇描述分解成更简单的步骤，确保每个细节在图像中的位置都恰到好处，从而为从文...

2023-09-20 talkingdev

在网上创建引人注目的设计对于吸引用户的兴趣和帮助他们理解信息非常重要。这种新方法，被称为LayoutNUWA，通过使用语言模型将编码指令转化为出色的布局，使这些设计更加智能。LayoutNUWA的核心在于，它通过理解编程...