当前位置: 首页 > 期刊 > 《中国中医药信息杂志》 > 2017年第12期
编号:13209730
基于Apriori改进算法的名老中医治疗糖尿病用药规律研究(2)
http://www.100md.com 2017年12月1日 中国中医药信息杂志 2017年第12期
     垂直数据存储的Apriori算法采用深度优先正向搜索策略,因此无法充分利用Apriori先验性质对候选集进行剪枝。此外,对2个频繁k项集的前缀进行比对耗费大量的时间,尤其在不能生成新的频繁项集的情况下。而随着迭代的加深,频繁项集的增长,这种前缀比对更加耗时,为此本研究提出了改进后的ADPM算法。

    定義1:设t(PX)为项集PX的TidSet(PX包含的事务ID集合),d(PX)为项集P和项集X的差集,d(PX)表示存在于t(P)中但不存在于t(PX)的事务ID集合,由集合的性质可以得到d(PX)=

    t(P)-t(PX)=t(P)-t(X)。见图1。

    由定义可知,ADPM算法中使用将待挖掘项集转换成其差集的方式,这样对于部分事务数据库,通过转换成差集的方式可较大程度减小参与并运算集合的大小。定义的性质中s(PXY)=s(PX)-

    |d(PXY)|=s(PY)-|d(PYX)| ......
上一页1 2 3下一页

您现在查看是摘要页,全文长 3641 字符