Fuyu-Heavy多模型表现超越Gemini Pro
talkingdev • 2024-01-26
1044535 views
Adept公司扩大了其Fuyu架构并训练了一个更大的版本,目前是MMMU上排名第三的最佳模型之一。该模型在其他任务中也表现良好(例如,在HumanEval编码基准测试中达到40+)。与其他替代方案相比,扩展此架构的挑战较少,部分原因是其简单性。但是,数据I/O、内存带宽和自定义内核开发仍然存在挑战。
核心要点
- Adept公司扩大了其Fuyu架构并训练了一个更大的版本,目前是MMMU上排名第三的最佳模型之一。
- 该模型在其他任务中也表现良好。
- 扩展此架构的挑战较少,部分原因是其简单性。