工具介绍:自动驾驶视觉语言模型
更新时间:2024-06-27 08:00:43
MMStar 视觉语言模型基准测试 MMStar是一个旨在评估大型视觉语言模型多模态能力的基准测试
MiniGemini 多模态视觉语言模型 Mini-Gemini是一个多模态视觉语言模型,支持从2
VILA 视觉语言模型视频理解 VILA是一个预训练的视觉语言模型(VLM),它通过大规模的交错图
ImageInWords 人工智能图像识别 优质新品 ImageInWords (IIW) 是一个