模型的相关内容 - 漫话开发者

2024-03-15 talkingdev

ViT-CoMer：新神经网络模型增强Vision Transformers的密集预测任务能力

近日，一项名为ViT-CoMer的神经网络模型问世，增强了Vision Transformers（ViT）在密集预测任务中的表现，而无需预训练。这项研究由卡内基梅隆大学的学者领导，他们在GitHub上公开了相关代码和数据集。ViT-CoMer能够...

2024-03-15 talkingdev

评估训练编程语言模型的性能是一个具有挑战性的任务。大多数人使用OpenAI的HumanEval。然而，一些开放的模型似乎会过度拟合到这个基准。LiveCodeBench是一种测量编程性能的方法，同时减轻污染问题。

2024-03-15 talkingdev

这项工作表明，您可以单独训练模型，然后将它们合并成单个Mixture-of-Experts模型。

2024-03-15 talkingdev

Figure 公司已经采用 OpenAI 技术，使得其机器人可以与人进行完整对话。OpenAI 的模型提供高级别的视觉和语言智能，而 Figure 的神经网络则可以提供快速、低级别的机器人动作。这篇文章包含一个视频，展示了一个人与...

2024-03-15 talkingdev

OpenAI宣布与Le Monde和Prisa Media合作，将他们的内容整合到ChatGPT中，以为用户提供交互式和深入的新闻访问，并协助模型训练。Le Monde和Prisa Media将提供大量的新闻和其他内容，以帮助改进ChatGPT的质量和精度。...

2024-03-14 talkingdev

据报道，OpenAI计划在进行漏洞测试和设置安全防护措施后，于今年晚些时候公开发布其文本到视频模型Sora。Sora是一种能够将自然语言描述转化为视频的模型，这项技术在影视制作和游戏开发中有着广泛的应用前景。OpenAI...

2024-03-14 talkingdev

最近的测试显示，像ChatGPT-4和谷歌的“Gemini Advanced”这样的先进AI模型在视觉智商测试中表现不佳，得分低于可测量的智商阈值。虽然ChatGPT-4表现出较强的模式识别能力，但它会出现视觉误认和逻辑错误，表明与人类...

2024-03-14 talkingdev

TripoSR是一种使用前向模型从2D图像重建3D模型的方法。它运行非常快，且接近于当前任务的最新技术水平。