apriori的基本原理,apriori算法连接步原理
找出频繁项集,逐层产生规则
文章目录 大体流程先知一分钟看图两分钟看手写真迹候选项集的产生(补充)
是关联规则的一个重要算法,使用基于支持度的剪枝技术,从而控制候选项集的指数级别的增长
大体流程先知 1.设定最小支持度和最小置信度2.扫描数据集,统计每个项的支持度计数,得到候选1项集3.计算每个项的支持度计数,筛选掉小于最小支持度的,得到频繁1项集4.合并再计算每个2项集的支持度计数得到候选2项集5.筛选掉小于最小支持度的,得到频繁2项集6.以此类推,当没有新的频繁项集产生后(即没有小于最小支持度的),迭代结束7.采用逐层的思想筛选强规则的 一分钟看图