FP-growth算法是目前较高效的频繁项集挖掘算法之一,但用于挖掘大型数据库却不能获得较高的效率。深入分析了造成低效的原因,提出一种基于格的快速频繁项集挖掘算法LFP-grwoth。LFP-grwoth算法利用等价关系将原来的搜索空间(格)划分成若干个更小的子空间(子格),通过子格间的迭代分解,将对网格P(I)的频繁项集挖掘转化为对多个子网格的并集进行的约束频繁项集的挖掘。实验结果和理论分析表明,LFP-growth算法在挖掘大型数据库时时间和空间的性能上均优于FP-growth算法。而且,随着数据库规模的增大或支持度阈值的减少,LFP-growth算法具有更明显的优势。
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。