GenAudit是一个旨在帮助校验大型语言模型(LLM)在文档支持任务中的响应的工具。它可以建议对LLM响应进行编辑,通过修正或移除未被参考文档支持的声明,并且为看似有支持的事实提供参考证据。
1. 对LLM生成的文本进行事实核查;2. 修正或移除与参考文档不一致的声明;3. 为有支持的事实提供参考文档中的证据;4. 提供交互式用户界面以便于用户进行事实核查。
GenAudit通过训练模型执行核查任务,能够准确发现不一致的声明和提供支持的参考证据,提高了文本准确性和可信度。
1. 医疗领域的研究人员使用GenAudit校验由LLM生成的病历摘要;2. 金融分析师利用GenAudit确保由LLM提供的财务报告摘要的准确性;3. 编辑和作者使用GenAudit来提高他们出版物中事实内容的准确性。
帮助用户提高文本准确性、增加文档的可信度、避免错误信息传播。
目前仅局限于支持文档核查任务,且可能受限于特定领域的模型训练成果。