顾及数据不确定性的关联规则显着性检验方法及装置【中国发明】
一、专利名称及专利号
名称:《顾及数据不确定性的关联规则显着性检验方法及装置》
专利号:ZL 201510076329 .0
二、应用领域
本发明属于数据挖掘技术领域,尤其涉及顾及数据不确定性的关联规则显著性检验方法及装置。
三、专利说明
1、摘要:
本发明适用于数据挖掘技术领域,提供了顾及数据不确定性的关联规则显著性检验方法及装置。所述方法包括:获取关联规则,并判断获取的所述关联规则是否为高效规则;若所述关联规则不为所述高效规则,则认为所述关联规则为虚假规则;若所述关联规则为所述高效规则,则对所述关联规则进行统计检验,并判断所得检验统计量的值是否低于预设显著性水平,若是,则接受所述关联规则为真实规则;若否,则认为所述关联规则为虚假规则。本发明基于统计健全检验法,能将族错误率控制在较低水平;修正随机数据误差对所述统计检验运算的影响,由此显著恢复由于随机数据误差引起的统计检验结果中真实规则的丢失,大大提高了关联规则挖掘结果的可靠性。
2、背景:
关联规则挖掘旨在提取数据库中所有符合给定兴趣度指标的规则,是数据挖掘中的一大研究课题。关联规则挖掘尤其适合探索现代数据库中复杂且多角的关系,目前已广泛应用于研究与实践中的数据分析与决策支持。
提升关联规则挖掘价值的关键在于获取可靠的结果,即发现有助于决策的真实规则,并避免表达数据中并不存在的虚假规则,以防误导用户做出错误决策。数据库中的项目很可能组合成数以万计甚至亿计的潜在规则,因此,挖掘结果中通常包含大量的虚假规则,这已成为关联规则挖掘结果可靠性的关键阻碍因素。另外,关联规则挖掘所用数据中普遍存在的误差是数据不确定性的一大来源。误差从源数据传播到关联规则挖掘中的每一个阶段,导致结果中真实规则的丢失和虚假规则的增加。
四、相关文件下载
专利证书:/UploadFiles/20220624/20220624091431813181.pdf
专利详情:/UploadFiles/20220624/2022062409140938938.pdf