Gemma和Siglip最近发布了一款小型但功能强大的视觉语言模型(VLLM),该模型专为理解和生成与图像相关联的语言而设计。VLLM利用大规模的LAION和LLaVA数据集进行训练,这些数据集包含了大量的图像和相关文本信息,使...
Read MoreLaion研究小组发布了一款开放式助手BUD-E,该助手采用自然语言和极度优化的语言模型,可在游戏笔记本电脑上运行。该项目旨在提供一种低资源的助手,易于安装且对个人使用功能强大。
Read More由于LAION等大规模数据集的删除,以及版权问题,使得训练大规模图像模型变得具有挑战性。但是,这项工作表明,使用3000万个全合成的图像可以训练出强大的CLIP模型。
Read MoreOpenLM是一个专为训练最多可达70亿参数的中等规模语言模型设计的库和框架。它的设计理念是注重GPU速度和可修改性。作为收敛性验证,已经有在1.25T标记上训练的模型可供使用。这种新型的框架和库能够更好地满足中等规...
Read More以下是该模型的三个核心要点: - 该模型能够处理多种语言的文本转图像,输出的质量非常高。 - 该模型基于LAION HighRes和内部专有图像数据集进行训练,尽管无法处理漫反射,但作者提供了在线演示。 - 该模型的参数...
Read More