摘要:
针对程序代码相似性检测度量忽略程序语义、出现无效度量的问题, 提出一种基于抽象语法树(AST:Abstract Syntax Tree)的程序代码相似性度量方法。通过预处理去除生成AST时的冗余信息, 再进行词法语法分析, 得到相应的AST; 然后通过自适应阈值的选取方式, 利用AST遍历得到的程序属性、 方法序列, 对AST进行相似度计算, 最终判定是否抄袭, 生成相似度检测报告。实验结果表明, 该方法能有效检测Java程序代码的多种抄袭行为。
中图分类号:
朱波, 郑虹, 孙琳琳, 杨友星. 基于AST的程序代码相似性度量研究[J]. 吉林大学学报(信息科学版), 2015, 33(1): 99-104.
ZHU Bo, ZHENG Hong, SUN Linlin, YANG Youxing. Research on Similarity Measure for AST-Based Program Codes[J]. Journal of Jilin University(Information Science Ed, 2015, 33(1): 99-104.