首页 > AI工具 > Griffon 多模态高分辨率 LVLM

Griffon 多模态高分辨率 LVLM

★★★★★ (0 评价)

工具介绍：

更新时间：2024-03-21 16:05:50

Griffon 多模态高分辨率 LVLM的信息

什么是Griffon

Griffon 是第一个具有本地化能力的多模态高分辨率（超过1K）LVLM（视觉与语言融合模型），能够描述用户感兴趣区域的所有内容。最新版本的 Griffon 支持视觉语言共指，用户可输入图像或文字描述进行操作。

Griffon 在 REC、目标检测、目标计数、视觉/短语定位和 REG 方面表现出色。
Griffon 具有本地化能力和多模态高分辨率特点，支持视觉语言共指，并可进行免费试用。

Griffon 可用于图像处理、目标检测、定位识别等多个场景，例如支持图像本地化任务、目标计数和检测，以及实现视觉/短语定位。

Griffon 能够帮助用户进行多模态高分辨率的 LVLM 操作，支持本地化能力和视觉语言共指，具备广泛的应用前景。

Griffon 多模态高分辨率 LVLM评价

Griffon 多模态高分辨率 LVLM的替代品

mPLUG-DocOwl 文档理解多模态 mPLUG-DocOwl 是一款用于文档理解的模块化多模

Mini-Gemini AI模型图像处理 Mini-Gemini是由香港中文大学终身教授贾佳亚团队

Reka Core 人工智能LLM 优质新品 Reka Core是一个GPT-4级别的多模态大型语

Meta Llama 3 大模型开源全球热门 Meta Llama 3是Meta公司推出的新一代

MiniCPM-Llama3-V 2.5 多模态端侧部署 MiniCPM-Llama3-V 2.5

CogVLM2 多模态预训练模型 CogVLM2是由清华大学团队开发的第二代多模态预训练对话模型，

Phi-3-vision-128k-instruct 多模态高质量优质新品 Phi-3 Visi

GLM-4V-9B 多模态预训练模型国外精选 GLM-4V-9B是智谱AI推出的新一代预训练模型