spark的数三角形算法_数据分析之图算法:基于Spark和Neo4j

spark的数三⾓形算法_数据分析之图算法:基于Spark和Neo4j 序 xi
前⾔ xiii
第 1章 导论 1
1.1 何谓图 1
1.2 何谓图分析和图算法 3
1.3 图处理、图数据库、图查询和图算法 5
1.4 为何要关⼼图算法 6
1.5 图分析⽤例 9
1.6 ⼩结 10
第 2章 图论及其概念 11
2.1 术语 11
2.2 图的类型和结构 12
镜片镀膜机
2.3 图的种类 14
2.3.1 连通图与⾮连通图 14
电极铜2.3.2 ⽆权图与加权图 15
2.3.3 ⽆向图与有向图 16
2.3.4 ⽆环图与有环图 17
2.3.5 稀疏图与稠密图 18
2.3.6 单部图、⼆部图和k部图 19
2.4 图算法的类型 21
2.4.1 路径查 21
2.4.2 中⼼性 21
2.4.3 社团发现 22
2.5 ⼩结 22
第3章 图平台和图处理 23
3.1 图平台和图处理的注意事项 23
3.1.1 平台注意事项 23
3.1.2 处理注意事项 24
3.2 典型平台 25
3.2.1 选择平台 25
3.2.2 Apache Spark 26
3.2.3 Neo4j图平台 28
3.3 ⼩结 30
第4章 路径查算法和图搜索算法 31
4.1 ⽰例数据:交通图 33
4.1.1 将数据导⼊Spark 35
4.1.2 将数据导⼊Neo4j 36
4.2 ⼴度优先搜索 36
4.3 深度优先搜索 38
4.4 最短路径算法 40
4.4.1 何时使⽤最短路径算法 41
4.4.2 使⽤Neo4j实现最短路径算法 41
4.4.3 使⽤Neo4j实现加权最短路径算法 43
4.4.4 使⽤Spark实现加权最短路径算法 44
4.4.5 最短路径算法的变体:A*算法 46
4.4.6 最短路径算法的变体:Yen的k最短路径算法 48 4.5 所有点对最短路径算法 49
4.5.1 近观所有点对最短路径算法 50
4.5.2 何时使⽤所有点对最短路径算法 51
4.5.3 使⽤Spark实现所有点对最短路径算法 51 4.5.4 使⽤Neo4j实现所有点对最短路径算法 52
4.6 单源最短路径算法 53
4.6.1 何时使⽤单源最短路径算法 54
4.6.2 使⽤Spark实现单源最短路径算法 55
4.6.3 使⽤Neo4j实现单源最短路径算法 57
4.7 最⼩⽣成树算法 57
4.7.1 何时使⽤最⼩⽣成树算法 58
显示器电路板
4.7.2 使⽤Neo4j实现最⼩⽣成树算法 59
4.8 随机游⾛算法 61
4.8.1 何时使⽤随机游⾛算法 61
4.8.2 使⽤Neo4j实现随机游⾛算法 61
4.9 ⼩结 63
第5章 中⼼性算法 64
5.1 ⽰例数据:社交图 66
折叠麻将桌5.1.1 将数据导⼊Spark 67
5.1.2 将数据导⼊Neo4j 67
5.2 度中⼼性算法 68
手机光线传感器5.2.1 可达性 68
5.2.2 何时使⽤度中⼼性算法 69
5.2.3 使⽤Spark实现度中⼼性算法 69
5.3 接近中⼼性算法 70
5.3.1 何时使⽤接近中⼼性算法 71
5.3.2 使⽤Spark实现接近中⼼性算法 72
5.3.3 使⽤Neo4j实现接近中⼼性算法 74
5.3.4 接近中⼼性算法变体:Wasserman & Faust算法 75 5.3.5 接近中⼼性算法变体:调和中⼼性算法 77
5.4 中间中⼼性算法 78
5.4.1 桥与控制点 78
5.4.2 计算中间中⼼性得分 79
5.4.3 何时使⽤中间中⼼性算法 79
5.4.4 使⽤Neo4j实现中间中⼼性算法 80
5.4.5 中间中⼼性算法变体:RA-Brandes算法 82
5.5 PageRank算法 83
5.5.1 影响⼒ 84
5.5.2 PageRank算法公式 84
5.5.3 迭代、随机冲浪者和等级沉没 85
5.5.4 何时使⽤PageRank算法 86
5.5.5 使⽤Spark实现PageRank算法 87
5.5.6 使⽤Neo4j实现PageRank算法 88
5.5.7 PageRank算法变体:个性化PageRank算法 90 5.6 ⼩结 91
第6章 社团发现算法 92
6.1 ⽰例数据:软件依赖图 94
6.1.1 将数据导⼊Spark 96
6.1.2 将数据导⼊Neo4j 97
6.2 三⾓形计数和聚类系数 97
6.2.1 局部聚类系数 97
6.2.2 全局聚类系数 98
6.2.3 何时使⽤三⾓形计数和聚类系数 98
6.2.4 使⽤Spark实现三⾓形计数算法 99
6.2.5 使⽤Neo4j实现三⾓形计数算法 99
6.2.6 使⽤Neo4j计算局部聚类系数 100
6.3 强连通分量算法 101
6.3.1 何时使⽤强连通分量算法 102
6.3.2 使⽤Spark实现强连通分量算法 102 6.3.3 使⽤Neo4j实现强连通分量算法 103 6.4 连通分量算法 106
6.4.1 何时使⽤连通分量算法 106
6.4.2 使⽤Spark实现连通分量算法 106 6.4.3 使⽤Neo4j实现连通分量算法 107
6.5 标签传播算法 108
6.5.1 半监督学习和种⼦标签 110
6.5.2 何时使⽤标签传播算法 110
6.5.3 使⽤Spark实现标签传播算法 110 6.5.4 使⽤Neo4j实现标签传播算法 111
6.6 Louvain模块度算法 113
6.6.1 通过模块度进⾏基于质量的分组 114 6.6.2 何时使⽤Louvain模块度算法 117 6.6.3 使⽤Neo4j实现Louvain模块度算法 118 6.7 验证社团 122
6.8 ⼩结 122
第7章 图算法实战 123
7.1 使⽤Neo4j分析Yelp数据 123
7.1.1 Yelp社交⽹络 124
7.1.2 导⼊数据 124
7.1.3 图模型 125
7.1.4 Yelp数据概览 125
7.1.5 ⾏程规划应⽤程序 129
7.1.6 旅游商务咨询 134
7.1.7 查相似类别 138
7.2 使⽤Spark分析航班数据 142
7.2.1 探索性分析 144
7.2.2 热门机场 144
7.2.3 源⾃ORD的延误 145
7.2.4 SFO的糟糕⼀天 147
7.2.5 通过航空公司互连的机场 149
7.3 ⼩结 154
第8章 使⽤图算法增强机器学习 155
8.1 机器学习和上下⽂的重要性 155
8.2 关联特征提取与特征选择 157
8.2.1 图特征 158
8.2.2 图算法特征 158
8.3 图与机器学习实践:链接预测 160
8.3.1 ⼯具和数据 161
8.3.2 将数据导⼊Neo4j 162
8.3.3 合著者关系图 163
8.3.4 创建均衡的训练数据集和测试数据集 164 8.3.5 如何预测缺失链接 169
8.3.6 创建机器学习管道 170
8.3.7 预测链接:基本图特征 171
8.3.8 预测链接:三⾓形和聚类系数 181 8.3.9 预测链接:社团发现 184
8.4 ⼩结 190
8.5 总结 190
附录 额外信息及资料 191
关于作者 195
关于封⾯ 195
>美发剂

本文发布于:2024-09-22 04:36:20,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/1/192940.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:算法   路径   实现   数据
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议