大型数据库关联规则挖掘 - Apriori

如果项集的频率大于(最小支持度×D中的事务总数),则称该项集为频繁项集

Apriori算法是挖掘布尔关联规则频繁项集的算法, Apriori算法利用的是Apriori性质:频繁项集的所有非空子集也必须是频繁的,模式不可能比A更频繁的出现
Apriori算法是反单调的,即一个集合如果不能通过测试,则该集合的所有超集也不能通过相同的测试。
Apriori性质通过减少搜索空间,来提高频繁项集逐层产生的效率

连接+剪枝

大型数据库关联规则挖掘 - Apriori