(12)发明专利说明书 | ||
(10)申请公布号 CN 113010597 A (43)申请公布日 2021.06.22 | ||
权利要求说明书 说明书 幅图 |
本发明提供一种面向海洋大数据的并行关联规则挖掘方法,包括海洋大数据预处理、海洋数值大数据离散化处理及并行关联规则挖掘三部分,数据离散化采用信息熵结合K‑means的方法,并行关联规则挖掘主要基于改进Apriori算法来完成,即基于Spark并行化Apriori算法,并将事务矩阵引入到了并行处理中,在迭代计算中简化事务矩阵,通过矩阵做逻辑“与”运算得到频繁项集和支持度,通过频繁项集与支持度计算关联规则。在计算过程中仅对该RDD进行操作,而不再扫描原始数据,从而通过内存计算加快了算法处理效率。通过剪枝来简约事务矩阵,减少后续迭代扫描范围和计算量,减少了I/O操作,有效解决了现有方法满足不了海洋大数据关联挖掘分析需求的问题。 | |
法律状态公告日 | 法律状态信息 | 法律状态 |
2021-06-22 | 公开 | 公开 |
2021-07-09 | 实质审查的生效 | 实质审查的生效 |
本文发布于:2024-09-23 04:28:30,感谢您对本站的认可!
本文链接:https://www.17tex.com/tex/1/412079.html
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
留言与评论(共有 0 条评论) |