CRM试用热线:400-600-7912
>

模型评价和结果解释

图5.9引入新的字段“时尚用户I

引人Type节点,按照5. 3. 1中的数据处理要求定义数据方 向,如图5. 10所示:

0       _

Ofil   Aprion COST jmSEft^P ‘»• R

B lai JL,1:

:•圖 m m

HMPxlc-Vfii&flP *    ‘     ~

图5. n模型建立的整个流程图 5.4.3.1未剪枝(剪枝少)树

未剪枝是指在枸建决策树的过程中,剪枝程度参数设置Default : F

  1. 4.4模型评价和结果解释

5.4.4. I 模型评价

是否对生成的决策树进行剪枝,或者说应该剪枝到什么程度, 这取决于多方面的因素,但最重要的参考因素是生成模型的精度。 我们首先来看未剪枝的树,该树共6层,生成的规则集共10条, 模型精度为85.3%,如图5. 13所示。我们可以看到,模型精度本 身并不是很高,没有达到90%,但作为对电信增值消费行为的分 析,这样的精度是可以接受的。因为目前人们对增值业务的需求 本身就不是很高,再加上每个消费个体的需求差异很大,所以模 型的精度对实际的CRM是有意义的,是可用的。经过多次设置不 同的剪枝程度,最终得到层次数为4,规则集数为7,精度为 83.4%的模型,如图5. 14所示。我们可以看出,最终确定的决策 树的层数和规则集数都比未剪枝树少,而模型精度相差并不多, 我们愿意牺牲微小的模型精度差别来换取更加简练的模型输出结 果,因为这样的结果更加具有实用性和可操作性。有时候,在不同的应用场合对模型的错判成本是不同的。