基于Web2_0网站中社会网络的信息挖掘

技术创新
《微计算机信息》(管控一体化)2009年第25卷第2-3期
360元/年邮局:82-946
《现场总线技术应用200例》
网络与通信
基于Web2.0网站社会网络的信息挖掘
Information Mining Based on Social-Network in Web2.0
(1.中国科学院高能物理研究所;2.中国科学院研究生院)
周卫国
1,2
史戎坚
1
叶婷
2
ZHOU Wei-guo SHI Rong-jian YE Ting
摘要:在Web2.0时代,网站注册用户之间相互交流、相互协作,通过引用、选举等各种方式,共同制造并挖掘出有价值的信
息。利用社会网络,我们可分析出用户之间的朋友关系,量化网站用户的权重。同时,我们还开发一个通用社会网络可视化平台,其可以帮助挖掘网站用户之间的关联关系,寻用户之间的最短路径,以及量化网络中团的耦合度等。关键词:社会网络;六度空间;最短路径;耦合中图分类号:TP393文献标识码:A
Abstract:Website registered users communicate and cooperate mutually to make and mine the valuable information together by cit -ing and voting in Web2.0.The relationship among the users and the proportion of the registered users are analyzed with Social-Net -works.General Social Network Visualization Platform is constructed in networks.This platform can help us to find out the relation -shi
ktp晶体
p among the users and search the shortest path between users and compute the coupling of group in the Websites.Key words:Social-Network;Six Dimension Space;Shortest Path;Coupling
文章编号:1008-0570(2009)02-3-0146-02
1引言
Web2.0网站中人与人之间的这种互动,形成了社会网络。本文阐述了社会网络的特征,以及如何评估每个结点之间的价
值和相互关系等。最后描述通用社会网络可视化平台
微计算机信息(General Social Network Visualization Platform,
)。此平台通过Web Service 接口,接受其他网站服务器传入的参数,为其构建并维护其中的社会网络,并对社会网络的特征进行分析,通过Web Service 与网页的方式返回分析的结果。
2社会网络的拓扑结构特征
在一个Web2.0网站中,社会网络具有特定的特征。首
先,一个社会网络是一种无尺度网络。如图1所示,
不同的结点对整个网络的价值不同,具有较多连接数的结点对整
图1完整的社会网络与崩溃的社会网络比较
个网络的重要性更高。当失去这些结点时,整个网络可能会被分裂成多个孤立的岛。另外,社会网络具有自动成长的特征:连结数多的结点往往能够吸引到更多的结点与之连结。
3构建网站中的社会网络
3.1挖掘用户间的朋友关系
一个Web2.0网站中通常包含用户发布的文章、标签(tag )等信息,我们统称之为元素(item )。网站用户通过浏览、引用、评价等各种方式与这些元素发生关联。对于任意两个网站用户
A 、
B ,
都可以拥有一组相同元素的集合,记为。对于集合中的每一个元素,被频繁引用的次数越多,其可用
于评估用户A 、B 之间的关联关系的价值就越低。
我们将freq(i)标识某个元素被其他用户引用的频率。则两个用户之间的关联关系
可以由公式(1
)计算而得:(1)
3.2量化网站用户的权重
我们在PageRank 理论的基础之上,借助公式(1),来评估网站用户的价值。在社会网络中,每个网站用户是一个结点,而用户之间的朋友关系是结点之间的弧。这个社会网络就形成了一个无向图。对于每个结点,其价值可定义为:
(2)
其中定义为:(3)在实际应用中,由于某些结点可能没有与其他结点产生关
联,故我们将公式(2
)调整为:(4)
4可视化Web2.0中的社会网络
在构建社会网络的数学模型的基础之上,我们开发了一个
通用社会网络可视化平台(GSNVP )。此平台的功能是接收其他网站服务器传递过来的数据,为其构建并维护社会网络,并提供了基于社会网络的一些扩展应用。图2展示了平台的整体架构。我们采用了Web Service 技术为其他的网站服务器提供接口传递的数据,系统会对这些数据进行分析,并基于社会网络提供一些扩展应用,包括寻某个结点的朋友圈,寻两个结点之间的最短路径,以及对整个网络进行抱团分析。在返回结果时,系统提供了两种形式:Web Service 接口与网页方式。表1中罗列了获取结果时主要的Web Service 接口:
周卫国:硕士研究生
146--
邮局:82-946360元/年技术创新1332m络筒机
网络与通信
《PLC 技术应用200例》
您的论文得到两院院士关注表1返回结果时提供的Web Service 接口
图2通用社会网络可视化平台整体架构4.1社会网络中的六度空间
六度空间理论是数学领域的一个猜想:任意两个陌生人之
间的间隔不会超过6个。
在Web2.0中的社会网络中,我们选择从任意一个注册用户出发,寻此用户在六度空间里的朋友圈。图3中便显示了用户A 的一度朋友圈以及二度朋友圈。
图3用户A 的一度朋友圈与二度朋友圈
4.2寻任意两个用户之间的最短路径
社会网络中任意两个结点之间的路径距离由两个因素决定:路径中弧的数量,以及每条弧的权值。设某条路径为,
其中为路径中所包含的弧。我们利用公式
(5)计算某条路径长度:
(5)
当一个结点加入时,我们通过广度优先遍历的方式计算此结点与其他所有结点之间的最短路径,并且缓存计算结果,从
而减少时间复杂度。
4.3量化网络中团的耦合度
在一个社会网络中,往往存在一个结点的子集,
在这个子集中每个结点之间都存在弧,从而形成了一个团。在
衡量团的耦合度时,需要考虑结点的权值以及结点之间弧的权
值。首先定义一个结点在一个团中的权值
,它与其他结点之间的关联程度为
可以利用公式(6)衡量出一个团的耦合度:(6)5总结与展望
在一个社会网络中,协作与共享是社会网络成长的主要动力。构建并可视化Web2.0网站中的社会网络,可以更好的维护整个社会网络,更好的在社会网络中共享信息,并更加有效的挖掘网络中有价值的信息。
太极解
到目前为止,我们所做的工作只是一次初探。随着Web2.0技术的发展以及社会网络的概念的流行,对社会网络的研究越来越值得关注。我们相信,对社会网络拓扑结构的分析,将是未来研究的一个重要方向。
本文创新观点:在Web2.0理论基础上,构建了通用社会网络可视化平台,并在信息挖掘中,量化了网络中用户的权重和团的耦合度等。参考文献
[1]王伟军,孙晶.Web 2.0的研究与应用综述[J].情报科学,2007,25(12).
[2]余夕亮,黄宏程.基于php 的web services 的研究与应用[J].微计算机信息,2008,2-3:130-140
[3]Robert    B.Cairns,Beverley    D.Cairns,Holly J.Neckerman.“Social Networks and Aggressive Behavior:Peer Support or Peer
Rejection?”
[J].Developmental ftychology,1988,Vol.24,No.6,815-823.
情感与形式[4]曹军.Google 的PageRank 技术剖析[J].情报杂志,2002,21(10).[5]周晋,李衍达.基于Small-World 网络的非结构化DHT 算法[J].计算机研究与发展,2005,42(1).作者简介:周卫国(1982-),男(汉),湖南双峰人,硕士研究生,研究方向为计算机网络及应用。史戎坚(1963-),男(汉),副研究员,硕士生导师,研究方向为加速器控制与技术。叶婷(1983-),女
(汉),
硕士研究生,研究方向为图像处理。Biography:ZHOU Wei -guo (1982-),Male (Han),Shuangfeng,Hu ’nan Province,master,major in Computer Networks and Ap -plication.
(100049中国科学院高能物理研究所)周卫国史戎坚(100080中国科学院研究生院)周卫国叶婷
(Institute of High Energy Physics ,Chinese Academy of Sci -ences ,Beijing100049)ZHOU Wei-guo SHI Rong-jian
(Graduate University of Chinese Academy of Sciences ,Beijing 100080)ZHOU Wei-guo YE Ting
通讯地址:(100049北京918信箱中国科学院高能物理研究所研发中心)史戎坚转周卫国
(收稿日期:2008.12.15)(修稿日期:2009.01.13)
(上接第149页)
作者简介:张炜,男,1982-,浙江绍兴人,2005年毕业于清华大
学计算机科学与技术系,现就学于中国科学院空间科学与应用
研究中心(简称中科院空间中心),攻读硕士研究生。研究方向:
紫外光传输系统中的视频传输。李霁野,男,1954-,
中国科学院空间科学与应用研究中心(简称中科院空间中心)研究员Biography :ZHANG Wei,male (1982-),graduate from Tsinghua
University,computer science and technology department,getting master degree ant Chinese Academy of Science,Space Technol -ogy Center.Research direction:Video Transmission in the UV
Communication System .国际海事组织
(100080中国科学院空间中心)张炜李霁野
(Chinese Academy of Science,Space Technology Center Bei -jing 100080,P.R.China )ZHANG Wei LI
Ji-ye
通讯地址:(100910北京市海淀区中关村北一条9号科电大厦515)张炜(收稿日期:2008.12.15)(修稿日期:2009.01.13)147--

本文发布于:2024-09-20 22:57:02,感谢您对本站的认可!

本文链接:https://www.17tex.com/xueshu/697982.html

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。

标签:网络   社会   用户   结点   网站   研究
留言与评论(共有 0 条评论)
   
验证码:
Copyright ©2019-2024 Comsenz Inc.Powered by © 易纺专利技术学习网 豫ICP备2022007602号 豫公网安备41160202000603 站长QQ:729038198 关于我们 投诉建议