分布式环境下海量图数据的可达性查询研究

分类号学号M********* 学校代码10487 密级
硕士学位论文
分布式环境下海量图数据
可达性查询研究
学位申请人:杨小静
学科专业:计算机软件与理论
指导教师:左琼讲师
答辩日期:2015年5月26日
A Thesis Submitted in Partial Fulfillment of the Requirements
for the Degree of Master of Engineering
Large Graph Reachability Query Research
on Distributed System
Candidate : Yang Xiaojing
Major : Computer Software and Theory
Supervisor : Lecturer Zuo Qiong
Huazhong University of Science and Technology
Wuhan 430074, P. R. China
May, 2015
独创性声明
本人声明所呈交的学位论文是我个人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除文中已经标明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的研究成果。对本文的研究做出贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律结果由本人承担。
学位论文作者签名:
日期:年月日
学位论文版权使用授权书
本学位论文作者完全了解学校有关保留、使用学位论文的规定,即:学校有权保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权华中科技大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。
保密□,在_____年解密后适用本授权书。
本论文属于
玉米棒烘干机
医用泡棉不保密
(请在以上方框内打“√”)
学位论文作者签名:指导教师签名:
日期:年月日日期:年月日
华中科技大学硕士学位论文
摘要染料敏化太阳能电池
水塔
图数据信息的应用极其广泛,存在于科学技术的各个领域,因此经常会遇到图数据信息中有关可达性查询的计算问题。随着数据量的急剧增长,传统的可达性计算方法已经无法满足大型图数据上的计算,这使得如何在大型图数据上进行可达性查询成为了一个亟待解决的问题。
图数据的可达性查询与其计算模型及处理算法密切相关。传统的可达性计算方法存在本地局限、处理数据量不足及扩展性差等缺点,其改良算法在百万级别顶点的图数据上也有限制,只适用于在单机环
境中进行计算。针对海量图数据的可达性问题,设计了在分布式环境下海量图数据的可达性计算框架,提供了一种可以对千万级顶点和亿级边的图数据进行可达性查询的方法。
陶瓷饰品针对于传统的可达性方法无法有效地处理分布式海量图数据的问题,设计了基于分布式文件系统的海量图数据的可达性计算框架。计算框架中对图进行了预处理,并设计了在分布式环境下针对可达性查询问题的均衡拓扑划分策略,经过一次划分使得子图内部拥有较好的内聚性;设计了分布式跨子图索引,在子图上出骨干顶点和外部联系顶点建立索引,用于有效地在划分后的子图内部和子图之间进行并行的可达性查询计算。通过图划分以及可达性连接测试表明,利用海量图数据的可达性计算框架,可以有效地对分布式下千万级顶点和亿级边的图数据进行可达性查询。
空调温度控制器
关键词:分布式计算,可达性查询,图划分,可达性索引
华中科技大学硕士学位论文
Abstract
Graph data gains its popularity in science and technology, so it often encounter computing problems about reachability queries. With the expanding of big data, traditional reachability methods can not meet the requirements on large graph data,which makes processing reachability queries on large graphs has become an important problem.
Reachability query is closely related to computing model and processing algorithms. Traditional reachability methods have issues of locality, insufficient processing ability and poor scalability. Improved algorithms are limited on stand-alone environment. To solve the reachability query problem for large graph, the reachability framework in a distributed environment for large graph is designed, in which massive million-level graph with tens of millions of vertices and edges can be computed and queried.
For processing the distributed large graph, a reachability framework for large graph is designed. The graph can be pre-processed and partitioned by Balanced Topology Graph Partition algorithms for the reachability queries, which makes subgraphs have good internel cohension by one-time partition. In addition, a distributed graph index Distributed Cross-Subgraph Index for efficient reachability queries of the subgraphs is designed, building indexes among the bone vertices and out vertices, makes the reachability queries can efficiently compute on the subgraphs. Both partition and reachability experiments proved that our reachabilty framwork for large graph reachability queries is more effective than traditional methods.
Key words: Distributed computing, Reachability query, Graph partition, Reachability index

本文发布于:2024-09-22 09:42:06,感谢您对本站的认可!

本文链接:https://www.17tex.com/tex/3/133893.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:数据   学位   进行   计算   查询   有关   顶点   海量
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议