SPRIGHT是一个专注于空间关系的大规模视觉语言数据集和模型,重新描述600万张图像构建数据集,通过微调训练优化生成具有空间关系的图像,提高了图像质量评分。
1. 大规模空间关系数据集;2. 微调训练以优化空间一致性;3. 实现了空间一致性的最新水平;4. 提高了图像质量评分。
SPRIGHT通过重新描述图像构建了大规模数据集,并采用微调训练优化生成具有空间关系的图像,在多个基准测试中实现了空间一致性的最新水平,并提高了图像质量评分。
SPRIGHT可应用于室内设计、平面布局、机器人环境模拟等场景,能生成具有合理空间布局的图像。
1. 优化生成具有空间关系的图像;2. 实现了空间一致性的最新水平;3. 提高了图像质量评分。
由于专注于空间关系,SPRIGHT可能在其他方面的图像生成表现上略有局限。