llava-llama-3-8b-v1_1是由XTuner优化的LLaVA模型,基于meta-llama/Meta-Llama-3-8B-Instruct和CLIP-ViT-Large-patch14-336进行微调,专为图像和文本的结合处理而设计,具备强大的多模态学习能力,适用于各种下游部署和评估工具包。
['多模态学习能力', '高效微调', '兼容性强', '大规模参数量']
模型通过ShareGPT4V-PT和InternVL-SFT微调,提升了适应性和准确性,兼容多种部署和评估工具包,性能强大。
['图像标注和描述生成', '社交媒体情感分析', '聊天机器人后端']
能够提升图像搜索准确性,增强社交媒体分析能力,提供更丰富的用户交互体验。
None