文章荟萃

基于属性识别方法的程序文本相似度检测方法

来源:2014年第26期 作者:蒋栋 点击:

程序文本相似度比较要综合考虑许多因素,涉及的内容较多,而国内外在这方面的研究又较少,因此,找到一个合适的方法来计算程序文本的相似度就成了本文的关键。笔者分析了各种程序文本相似度比较算法的优缺点,并根据属性计数法的特点,重点研究了程序文本属性的特点、相似程序文本的检测方法及相似度求解标准,提出了一种相对简单和合理的程序文本相似度检测方法。一、属性识别方法程序文本相似度检测方法的依据程序的属性是程序的主要特征,它反映了程序的内在性质。每段程序代码都有多种不同的属性特征,其中可以分为两大类:一类是不可统计和分析的,例如,程序名称、编程语言,等等;另一类是可统计的,如程序所占内存大小,程序的行数,程序中操作数额操作符个数、程序中结构体个数等。为了比较程序文本的相似性,笔者通过统计和分析程序中可统计分析的属性,例如,程序中操作数的个数,操作符的个数,大量实验证明,任何语言写的任何程序都具有可测量的属性值,通过统计分析程序文 ...

《中外企业家》  主管单位:哈尔滨工业大学    主办单位:中外企业家杂志社    ISSN:1000-8772    国内刊号:23-1025/F    邮发代号:2-287    创刊年:1984
未经本刊授权,不得转载本站资料