往期目录
文章荟萃
决策树分类法在就业面试中的应用研究
来源:2010年第08期 作者:徐枫 点击:
次
1决策树分类概述决策树分类方法是数据挖掘中一种重要的分类方法。所谓决策树就是一个类似流程图的树型结构,决策树是以实例为基础的归纳学习算法。它从一组无次序、无规则的元组中推理出决策树表示形式的分类规则。它采用自顶向下的递归方式,在决策树的内部节点进行属性值的比较,并根据不同的属性值从该结点向下分支,其中树的每个内部节点代表对一个属性的测试,叶结点是要学习划分的类。从根节点到叶结点的一条路径就对应着一条分类规则,整个决策树就对应着一组析取表达式规则。树的最高层点就是根节点。目前已经形成的决策树算法有:ID3,C4.5,SLIQ,SPRINT,RainForest,CLS,CHAID,CART,FACT,GINT,SEE5等。其中比较有著名的是Quinlan提出的ID3算法,以及在ID3算法基础上提出的C4.5算法。2ID3算法描述ID3算法是Quinlan提出的一个著名决策树生成方法。它的基本概念是决策树中每一个非结点对应着一个非类别属性,树枝代表这个属性的值。一个叶结点代表从树根到叶结点之间 ...