成果介紹
本發(fā)明適用信息技術(shù)領(lǐng)域,提供了一種大規(guī)模數(shù)據(jù)集的頻繁項(xiàng)集挖掘方法、裝置、設(shè)備及介質(zhì),該方法包括:估算樣本容量,從大規(guī)模數(shù)據(jù)集中采集樣本容量大小的樣本數(shù)據(jù)集,挖掘樣本數(shù)據(jù)集中的閉頻繁項(xiàng)集并計(jì)算大規(guī)模數(shù)據(jù)集對(duì)應(yīng)的最大長度約束,以生成大規(guī)模數(shù)據(jù)集對(duì)應(yīng)的縮減數(shù)據(jù)集,通過縮減數(shù)據(jù)集構(gòu)建大規(guī)模數(shù)據(jù)集的噪聲FP?Tree,將隱私預(yù)算平均分配給噪聲FP?Tree的每一層,通過噪聲FP?Tree和噪音閾值選出候選集合,通過幾何機(jī)制噪音增加候選集合的隱私保護(hù),再從候選集合中選出預(yù)預(yù)設(shè)數(shù)量個(gè)頻繁項(xiàng)集,從而減小了大規(guī)模數(shù)據(jù)集頻繁項(xiàng)集挖掘的計(jì)算強(qiáng)度,保證了數(shù)據(jù)挖掘的隱私性,同時(shí)降低了全局敏感度、提高了數(shù)據(jù)和挖掘結(jié)果的可用性。
成果應(yīng)用案例介紹
方法過程>其它方法過程>大規(guī)模頻繁項(xiàng)數(shù)據(jù)集挖掘方法