CRM试用热线:400-600-7912
>>>

关联规则挖掘的核心

同层关联规则可以采用两种支持度策略: 一是统一的最小支持麼,即对于不同层次都使用同一个最小支 持度,这种策略容易实现,但存在弊端;二是递减的设小支持 度,即每个层次都有不同的iti小支持庶,较低层次的设小支持 度较小。同时,上层挖掘得到的信息可以作为过滤时的参考。 层间关联规则考虑最小支持度的时候,以较低层次的设小支持涉及的数据的维数,关联规则可以分为单维的和多维的。在单 维的关联规则中,只涉及数据的一个维,而在多维的关联规则 中,要处理的数据涉及多个维。换言之,单维关联规则是处理 单个屈性中的一逕关系,多维关联规则是处理各个属性之间的 菜些关系。

关联规则挖掘的核心符法是由阿格拉沃尔(Agrawal)等在 1993年设计的一个鞋本!?:法,提出了挖掘关联规则的一个重要 方法。这是一个基于两阶段频媒思想的方法,将关联规则挖掘 算法的设计分解为两个子问题:找到所有支持度大于最小支持 度的项集(Itemset),这些项集称为频集(Frequent Itemset)。使 用找到的频集产生期望的规则。这里相对简单一点,如给定了 —个频集h,k^2,          产生只包含集合(/■,

…,/J中的项的所有规则(最多A条),其中每一条规则 的右部只有一项。这些规则一经生成,就只有那些大于用户给 定的最小可信度的规则才被留下束。为了生成所有频集,使用 了递推的方法。