漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-20 talkingdev

Google的AI蛋白质折叠器在看似不存在的地方识别出结构

Google的AlphaFold在确定两种内在无序蛋白质的特定结构中起到了关键作用,这两种蛋白质在相互作用时诱发出之前未识别的结构。这项发现揭示了这类蛋白质如何发挥功能,并为之前难以回答的复杂生物问题提供了宝贵的见...

Read More
2023-09-20 talkingdev

HF transformers,最新的背景移除技术

Matting是一种创建黑白掩膜以分割出图像重要部分的过程。它通常用于前景和背景的分割。智能手机的人像模式使用了一种与这里描述的ViTMatte相似的方法。这种技术发展现代化,为未来的图像处理技术开创了新的可能。此...

Read More
2023-09-20 talkingdev

让深度估计更具灵活性

从单一的2D图像中确定3D深度是一项棘手的任务,因为许多3D场景在2D中看起来可能相同。这种方法将相机的细节与图片的内容进行了分离,使得在各种情况下更容易猜测深度。这种深度估计的灵活性可以在各种复杂环境下,如...

Read More
2023-09-20 talkingdev

论文:将长篇文字转化为图像,提升文本到图像生成的新方法

将长篇文字转化为图像一直是一项艰巨的任务,尤其当需要展示的项目或细节众多时。然而,一种新的方法打破了这个困扰。这种新的方法将长篇描述分解成更简单的步骤,确保每个细节在图像中的位置都恰到好处,从而为从文...

Read More
2023-09-20 talkingdev

CulturaX发布6T多语言数据标记,助推多语言模型发展

在谷歌的新数据集发布后,CulturaX紧随其后,推出了新的数据集。这是一个清洁整理过的多语言数据标记集,总量达到了6T。这一数据集的发布,将为多语言语言模型的进一步发展提供巨大的助力。谷歌和CulturaX的这两次数...

Read More
2023-09-20 talkingdev

LayoutNUWA-使用LLM生成优化网页布局

在网上创建引人注目的设计对于吸引用户的兴趣和帮助他们理解信息非常重要。这种新方法,被称为LayoutNUWA,通过使用语言模型将编码指令转化为出色的布局,使这些设计更加智能。LayoutNUWA的核心在于,它通过理解编程...

Read More
2023-09-20 talkingdev

PIPS2开源,实时追踪数百个点的最新技术

PIPS2是一种最新的点追踪系统,能够进行密集的像素级追踪,并且能抵抗基础遮挡和快速运动。这种技术通过实现密集的像素级追踪,提供了一种更为精细和准确的方式来追踪和分析运动。此外,PIPS2的设计使其能够在遭受基...

Read More
2023-09-20 talkingdev

Nova-2,超能力语音转文本助力应用开发

全球最强大的语音转文本(STT)模型Nova-2已经来临。相较于其他选项,Deepgram的Nova-2提供了下一级的准确度和极速的速度,使得语音AI功能的快速实现成为可能。如果你想了解更多信息或者开始使用,现在注册就可以获得2...

Read More
  1. Prev Page
  2. 914
  3. 915
  4. 916
  5. Next Page