漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-15 talkingdev

ViT-CoMer:新神经网络模型增强Vision Transformers的密集预测任务能力

近日,一项名为ViT-CoMer的神经网络模型问世,增强了Vision Transformers(ViT)在密集预测任务中的表现,而无需预训练。这项研究由卡内基梅隆大学的学者领导,他们在GitHub上公开了相关代码和数据集。ViT-CoMer能够...

Read More
2024-03-15 talkingdev

LiveCodeBench:对大型编程语言模型进行全面无污染的评估

评估训练编程语言模型的性能是一个具有挑战性的任务。大多数人使用OpenAI的HumanEval。然而,一些开放的模型似乎会过度拟合到这个基准。LiveCodeBench是一种测量编程性能的方法,同时减轻污染问题。

Read More
2024-03-15 talkingdev

Branch-Train-MiX:将专家LLM混合到Mixture-of-Experts LLM中

这项工作表明,您可以单独训练模型,然后将它们合并成单个Mixture-of-Experts模型

Read More
2024-03-15 talkingdev

Figure 机器人现在可以与人进行完整对话

Figure 公司已经采用 OpenAI 技术,使得其机器人可以与人进行完整对话。OpenAI 的模型提供高级别的视觉和语言智能,而 Figure 的神经网络则可以提供快速、低级别的机器人动作。这篇文章包含一个视频,展示了一个人与...

Read More
2024-03-15 talkingdev

OpenAI宣布与Le Monde和Prisa Media合作,将其内容整合到ChatGPT中

OpenAI宣布与Le Monde和Prisa Media合作,将他们的内容整合到ChatGPT中,以为用户提供交互式和深入的新闻访问,并协助模型训练。Le Monde和Prisa Media将提供大量的新闻和其他内容,以帮助改进ChatGPT的质量和精度。...

Read More
2024-03-14 talkingdev

OpenAI计划今年发布文本到视频模型Sora

据报道,OpenAI计划在进行漏洞测试和设置安全防护措施后,于今年晚些时候公开发布其文本到视频模型Sora。Sora是一种能够将自然语言描述转化为视频的模型,这项技术在影视制作和游戏开发中有着广泛的应用前景。OpenAI...

Read More
2024-03-14 talkingdev

顶尖人工智能仍未通过智商测试

最近的测试显示,像ChatGPT-4和谷歌的“Gemini Advanced”这样的先进AI模型在视觉智商测试中表现不佳,得分低于可测量的智商阈值。虽然ChatGPT-4表现出较强的模式识别能力,但它会出现视觉误认和逻辑错误,表明与人类...

Read More
2024-03-14 talkingdev

TripoSR:使用单张图像实现3D重建

TripoSR是一种使用前向模型从2D图像重建3D模型的方法。它运行非常快,且接近于当前任务的最新技术水平。

Read More
  1. Prev Page
  2. 292
  3. 293
  4. 294
  5. Next Page