漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-15 talkingdev

Figure 机器人现在可以与人进行完整对话

Figure 公司已经采用 OpenAI 技术,使得其机器人可以与人进行完整对话。OpenAI 的模型提供高级别的视觉和语言智能,而 Figure 的神经网络则可以提供快速、低级别的机器人动作。这篇文章包含一个视频,展示了一个人与...

Read More
2024-03-15 talkingdev

OpenAI宣布与Le Monde和Prisa Media合作,将其内容整合到ChatGPT中

OpenAI宣布与Le Monde和Prisa Media合作,将他们的内容整合到ChatGPT中,以为用户提供交互式和深入的新闻访问,并协助模型训练。Le Monde和Prisa Media将提供大量的新闻和其他内容,以帮助改进ChatGPT的质量和精度。...

Read More
2024-03-14 talkingdev

OpenAI计划今年发布文本到视频模型Sora

据报道,OpenAI计划在进行漏洞测试和设置安全防护措施后,于今年晚些时候公开发布其文本到视频模型Sora。Sora是一种能够将自然语言描述转化为视频的模型,这项技术在影视制作和游戏开发中有着广泛的应用前景。OpenAI...

Read More
2024-03-14 talkingdev

顶尖人工智能仍未通过智商测试

最近的测试显示,像ChatGPT-4和谷歌的“Gemini Advanced”这样的先进AI模型在视觉智商测试中表现不佳,得分低于可测量的智商阈值。虽然ChatGPT-4表现出较强的模式识别能力,但它会出现视觉误认和逻辑错误,表明与人类...

Read More
2024-03-14 talkingdev

TripoSR:使用单张图像实现3D重建

TripoSR是一种使用前向模型从2D图像重建3D模型的方法。它运行非常快,且接近于当前任务的最新技术水平。

Read More
2024-03-14 talkingdev

SemCity:通过3D扩散模型实现真实世界室外场景生成

由于室外数据的复杂性和空白性,真实世界的室外环境一直是3D场景生成中被忽视的挑战。SemCity通过专注于真实世界的室外环境,彻底颠覆了3D场景生成,实现了真实的室外场景生成。SemCity通过3D扩散模型,将真实世界的...

Read More
2024-03-14 talkingdev

论文:SSMs-线性内存消耗与高质量的视频生成

这项研究介绍了一种创新的视频生成方法,使用状态空间模型(SSMs)克服了传统的基于注意力扩散模型的内存限制,重点关注线性内存消耗。在UCF101和MineRL Navigate数据集的测试中,SSMs能够创建具有竞争力质量的更长...

Read More
2024-03-14 talkingdev

MoAI:整合视觉任务信息的增强型语言模型

MoAI是一种新型的大型语言和视觉模型,它通过整合专门的计算机视觉任务的辅助视觉信息来增强当前模型。该模型在 GitHub 上发布,旨在改善自然语言处理和计算机视觉任务之间的互动。MoAI使用了一种新的训练方法,可以...

Read More
  1. Prev Page
  2. 261
  3. 262
  4. 263
  5. Next Page