CRM试用热线:400-600-7912
>

普通信息的挖掘方法

首先产生频繁1-项狼L,,然后是频繁2-项梁直到有茶 个r值使得为空,这时货法停止。这里在第&次循环中,过 程先产生候选/:-项猫的染合C,,的每一个项银是对两个只 有—个项不同的屈于的频染做—个连接来产生的。 中的项集是用来产生频染的候选狼,设后的频集/V必须是C‘ 的一个子渠。C,.中的每个元素’r7纟在交易数据库中进行验证来决 定其是否加入这里的验证过程是5):法性能的一个瓶颈。这 个方法要求多次扫描可能很大的交易数据库,即如果频集最多 包含10个项,那么就需要扫描交易数据库10遍,这^?^^要很大的 //0负载。可以果用修剪技术来减小候选集的大小,由此可以显 著地改进生成所有频集?):法的性能。货法中引人修剪策略是基 于这样一个性质:一个项集是频集当且仅当其所有子集都是 频集。

对于许多应用来说,由于数据的分散性,很难在数据的细 节层面上发现强关联规则。在数据挖掘中引入概念层次,就可 以在更高的层次进行挖掘。虽然较高层次上挖掘产生的信息可 能是更普通的信息,但是并非对于所有用户都是如此。因此, 数据挖掘应该提供这样一种多层次上的挖掘功能。

根据规则中涉及的层次,多层关联规则可以分为同层关联 规则和层间关联规则。多层关联规则的挖掘越本可系用“支持 度一可信度”的框架。