MoMA Personalization是一款基于开源Multimodal Large Language Model (MLLM)的个性化图像生成工具,专注于主题驱动的个性化图像生成。
1. 基于大语言模型的图像生成;2. 支持主题驱动的个性化图像生成;3. 无需fine-tuning,直接应用于现有diffusion模型。
MoMA可以根据参考图像和文本提示生成高质量、保留目标物体特征的图像,同时提高生成图像的细节和prompt忠实度。
1. 将自己的照片放入网站,生成与特定背景或场景相匹配的图像;2. 根据文本描述生成符合要求的图像;3. 将现有图像的背景替换为白色或其他颜色。
MoMA生成的图像质量高,保留目标物体特征,同时无需fine-tuning,提升了生成图像的细节和prompt忠实度。