LLM4Decompile是一个开源项目,专门用于反编译的LLM(大型语言模型)。该项目通过编译大量C代码样本到汇编代码,然后使用这些数据对DeepSeek-Coder模型进行微调,构建反编译基准Decompile-Eval。
1. 编译C代码样本到汇编代码;2. 微调领先的代码LLM模型;3. 构建基于HumanEval问题和测试样本的评估基准。
LLM4Decompile具有高度准确的反编译能力,适用于软件安全分析、漏洞研究和逆向工程领域。
适用于需进行二进制代码反编译的研究人员、软件开发者,尤其是在软件安全分析、漏洞研究和逆向工程领域。
安全研究人员可通过LLM4Decompile进行疑似恶意软件的二进制代码反编译分析;软件开发者可利用该项目从遗留的二进制代码中恢复源代码进行维护和更新;学术研究人员可探索新的反编译技术和程序分析方法。
目前尚无明显的局限性。