CRM试用热线:400-600-7912
>>>

购物篮分析一关联规则

定义/为过度训练树,/。为(/)的具有最少节点子树。如果复 杂度参数(Cost Complexity Parameter) a:足够大,则/。设终为仅 包含根节点的评估常数;当0;由0增至无穷时,仅有有限对应 于a的入。对0 = «,       整数&小于或等于过度训练树/

的叶节点的数^1,对于设人是具有设小节点的子 树。由此,我们可以生成节点数逐次降低的分类回归树序列人M ••丄,/。,为初始树,/„<为仅包含根节点的树。

最后,从分类回归树序列人I,…,人^中选择最优化的复杂度 参数a。可以通过交叉有效性评估的方法来实现对冗余平方和R if)和通小回归估计值的估计,从而确定a。

3.3.3购物篮分析一关联规则

两个或多个变诅之间存在某种规律性,我们就称之为关联。 数据关联是数据库中存在的一类重要的可被’发现的知识。关联 规则(Association Rules)是数据挖掘的一个重要方面。通过数 据挖掘找到的关联规则可以使用户更直观地发现数据之间的关 系。例如,将数据挖掘应用在超市,关联规则是发现不同商品 之间的联系,这些规则找出顾客的购买行为模式,也被人们称 为购物篮分析。通过分析购买茶一商品对购买其他商品的影响, 可以使超市更加合理地设计货架、摆放商品、安排存货以及根 据购买模式对客户进行分类。设/=(〖,,“,…,ij逛二进制文字的猫合,其中的元索 称为项(Item)。记/>为交易(Transaction) r的集合,这里交 是项的染合,并目.r?。