您好,欢迎来到尔游网。
搜索
您的当前位置:首页社交网络中微博用户行为的分析与预测

社交网络中微博用户行为的分析与预测

来源:尔游网
第47卷第6期 太原理工大学学报 VoI.47 NO.6 NOV.2O16 2016年11月 joURNAL OF TAIYUAN UNIVERSITY OF TECHN0L()GY 文章编号:1007—9432(2016)06—0786—07 社交网络中微博用户行为的分析与预测 刘 敏,王 莉 (太原理工大学计算机科学与技术学院,太原030024) 摘 要:从真实的新浪微博数据中分析用户的转发行为,提取了用户特征、微博特征、交互特征 和结构特征等4个方面的影响转发行为的因素。通过实证分析各个特征对转发行为的具体影响, 并利用机器学习中的不同预测算法对用户是否会对给定主题的微博产生转发行为进行预测。实验 表明,用我们选取的因素,结合逻辑回归模型对于用户转发行为的预测更加准确。 关键词:社会网络;微博;转发行为;预测 中图分类号:TP182 文献标识码:A DOI:10.16355/j.cnki.issnlO07 9432tyut.2016.06.019 Analysis and Prediction of Microblog User Behavior on Social Networks LIU Min。WANG Li (College of Computer Science and Technology,Taiyuan University of Technology。"Faiyuan 030024,China) Abstract:Microblog is a platform on which the public can put forward their opinions and communicate with each other.Retweet behavior iS the key mechanism for information diffusion on microblogging networks.On the basis of real data from Sina Weibo,this paper predicts users’ retweet behavior using four features which affect user’S behavior,including user attributes,mi— croblog text features,interactive attributes and IocaI structures.Furthermore,we utilize differ— ent supervised classifiers to predict retweet behavior.The experiments and evaluation show the effectiveness of our feature choices.The results show that the selected,features combined with the Logistic Regression model,can predict users’sretweet behavior more accurately. Key words:social networks;microblog;retweet behavior;prediction 随着互联网技术以及移动技术的发展,基于互 行为的预测,可以准确地预测出一条微博的传播范 联网的社交媒体及应用快速发展_1],人们在信息化 进程中尽情的遨游,享受着网络带来的便捷与乐趣, 尤其是社交网站、博客等在线社会网络的蓬勃发展 不仅带来了信息传播方式的技术性变革,而且在无 形中改变着人们思维方式和人际交往形式 j。 围和发展趋势等;同时在这个过程中,可以提前对有 害的微博信息传播过程进行有效地干预,控制信息 传播的范围。 相关研究 在信息时代,如何高效的获取信息和传播信息 成为社会中很多领域的需求,包括市场营销、舆情管 其中以原创性、时效性、草根性著称的微博表现 出非常强劲的发展势头。微博的出现极大地促进了 信息在网络中的传播速度,不同级别用户的转发,都 可能让信息传播规模以几何级别递增l3]。如今,微 博已经成为信息扩散和交流的平台,针对用户转发 控和热点选取等领域 ,因此,对社交网络中信息传 播的行为研究已经成为学者们研究的热点。 前期有许多研究用户转发行为的工作。文献 收稿日期:2016-04—25 基金项目:山西省自然科学基金资助项目:基于媒体大数据的信息消费服务关键技术及示范应用(2014AA015204) 作者简介:刘敏(1991一)。女,太原人,硕士生,主要研究领域为社会网络与人工智能,(E-mail)lm22056@sina.corn 通讯联系人:王莉,博士,教授,计算机学会(CCF)会员,主要研究领域为人工智能与网络通信,(E—mail)wangli@tyut.edu.cn 第6期 刘 敏,等:社交网络中微博用户行为的分析与预测 787 E5]对影响Twitter转发的文本特征和用户特征进 行分析,用主成份分析法(PCA)分析得出影响转发 新浪微博数据。 数据按照以下过程抓取,先随机选择100位种 的主要因素包括URL数目、hashtags数目、粉丝数 和关注数。文献[6]分别选取了影响转发的11个用 户特征和11个文本特征,并用信息增益的方法对特 征进行加权分析,最后用支持向量机(SVM)建立行 为预测模型。文献[7]简单地将用户特征和微博包 含的单词数等特征抽离出来,建立了基于概率的协 同过滤模型对用户转发概率进行预测,显然这些特 子用户,然后收集他们的关注者和关注者的关注者。 抓取过程收集到170万用户,总共3亿的好友关注 关系,通过计算,每个用户平均有200个粉丝。对于 每个用户,抓取其最近发布的1 000条微博(包括原 始和转发的微博)。 本文重点在于研究用户转发行为,因此主要根 据消息传播列,平均每条微博被转发次数为80次。 征不是主要的影响因素。文献E8]的研究指出了转 发链的长度是有限的,转发链越长,用户对于原始消 息的转发概率会越小。 在各种不同研究方法中,有一些人开始关注用 户所处的环境对于用户的影响,例如,文献[9]从微 博数据中发现用户所处局部社会结构很大程度上会 影响用户的转发行为,最后用逻辑回归模型学习得 出预测转发行为模型。文献[10]的研究发现用户是 受到周围活跃邻居节点的连接组成的影响,而不是 受到活跃邻居节点的个数影响。文献[11]利用的思 想是一个用户受周围邻居节点的影响,如果周围的 活跃节点个数较多,那么这个用户转发的概率就会 增大,进而提出线性阈值模型(Linear threshold model,LTM)来预测用户的转发行为。 以上这些对于用户转发行为已经有了一定的研 究成果,但文献[7,II]没有考虑用户本身的兴趣趋 向,即没有考虑用户是不是对自己感兴趣的微博更 容易产生分享行为;文献[i0]虽然考虑了用户所处 的局部结构会对转发行为产生影响,但最后预测的 准确率只有71.93 ,这就要考虑在建模过程中选 取的其他因素是否合适。 针对以上研究的不足,笔者根据真实的微博数 据,结合前人的研究,选取4个方面包含9个影响转 发行为的因素,较传统的研究相比,既考虑到用户周 围邻居节点的局部结构又考虑了用户近期的情况, 如活跃度、交互度、兴趣等,对各因素进行实证分析, 然后再加上一些基本特征,利用机器学习中4种常 用的有监督分类算法对用户转发行为进行预测。实 验结果表明,本文提取的特征因素结合逻辑回归算 法可以很好地解决在微博中对于转发行为的预测问 题,可以使F 度量值到达76.43 。 2 数据描述 本文使用中国最大的微博平台——新浪微博的 数据,数据集是由清华大学唐杰副教授团队公布的 表1列出了提取数据的信息。 表1新浪微博数据 Table 1 Sina weibo Dataset #Following— #Original— 【Dateset #Users 拭Retweets relationships microblogs Weibo 1 776 95O 308 489 739 3OO O0O 23 755 810 2.1问题的描述 在微博网络中,每一个用户都可以关注其他用 户,关系网络可以看作是一个有向图,我们用G一 (【,,E,M)来描述微博网络,其中【,表示所有用户 的集合,E u×u是所有用户之间的关系,e ∈E 意味着用户 关注了用户U,M表示网络中原创微 博和转发微博的集合。用户的转发行为所构成的消 息传播网络是用户关系网络中的一个子网。 图1是一个简单的消息传播图,在图中实线箭 头表示关系网络,表示73关注了“, 关注了 ;虚线 箭头表示消息传播网络, 转发了 发的原始微博 m,,z转发了 的微博m , 是二级转发节点, 也可 以直接转发u的微博。 图1微博消息传播图 Fig.1 Illustration of information diffusion 定义1用户转发行为预测问题。假设用户 发了一条微博m,用Y ===f(u, ,m)表示其粉丝 在 看到m后采取的行为,其中Y ∈{0,1},当 一1表 示转发,Y 一0表示不转发,这是一个典型的二分类 问题。 2.2识别转发行为 数据集中含有微博消息传播序列,数据格式如 表2,例如对于消息m,记载了发布用户id,发布时 间,还记载了所有在抓取时间范围内转发过消息 的用户以及转发时间等信息,只要用户在消息列表 788 太原理工大学学报 第47卷 中我们就说该用户转发了这条微博。 表2消息格式 Table 2 Retweet information format 2.3识别不转发行为 本文要研究影响用户行为的因素,需要知道在 何种情况下,人们愿意将微博分享给自己的关注者, 因此不转发行为的判定也是至关重要的。相比于转 发行为的识别,不转发行为在数据集中没有记录。 我们知道大部分情况下用户只是浏览和转发自己所 关注人的微博,故有如下定义。 定义2若用户 在t时刻转发了微博,则将他 关注的用户在[ 一t, + ]时间区域内发表的且未被 转发的行为称为不转发行为。 在微博机制中,消息是按照时间的倒序显示在 页面上的,用户通常是从上到下浏览,当用户遇到自 己感兴趣的微博并认为值得转发时,他才会转发(假 设时间戳为t ),故在他点击转发动作产生时间 It 一t,t +£]范围内其关注的用户发布的微博有很 大可能性被他阅读。如果没有产生转发则是忽略了 该条微博,这里t取30 rain。 3 影响因素分析 微博网络中的用户之间是通过关注与被关注关 系联系起来的,并且微博消息绝大部分是靠关系网 传播扩散n 。在本节中将验证提取出的特征因素 对于用户转发行为的影响,进而选取适宜的模型来 预测行为。本文提取的特征因素主要包括四个方 面:用户特征、微博特征、交互特征和结构特征。 3.1用户特征 3.1.1 发布用户的影响力 一个微博发布用户的影响力高低会影响自己所 发微博的影响力,进而影响其他用户的转发行 为口 。直观上,如果一个人的粉丝数越多,那么这 条微博就更容易得到最大限度的传播,但是粉丝中 存在很多假粉丝,仅从粉丝的数量上来判断用户的 影响力是不够的,还要看粉丝的质量如何。基于上 述考虑,我们采用PageRank算法来评价用户的影 响力_1 ],该算法利用社交关系网络,能够相对客观 地反映用户的影响力。 发布用户PageRank值的计算公式如下: PR -(1_ ・(1) 式中:PR(“ )为用户 ,的PageRank值;F(U )为用 户 的粉丝数集合;0( )为用户 ,关注用户数;d 为阻尼系数(Damping Factor),0< <1,d的设置 会影响算法的性能和排名效果,一般取0.85。 首先,根据用户关系网计算出用户的PageRank 值,然后根据PageRank值的大小进行排名,接着统 计用户发布过的所有微博的平均转发量。我们将每 10个用户的转发量平均后的值作为一个节点,总共 统计前8 000的用户影响力排名和转发量的关系, 如图2所示,横轴表示影响力排名,纵轴表示微博的 平均转发量。可以看出转发量随着影响力的降低呈 下降趋势,表明影响力高的用户发布的微博确实会 引起人们的关注和转发。 影啊力排名 图2 用户影响力排名和平均转发量的关系 Fig.2 Relation between users’PageRank ranking and retweet number 3.1.2 用户的转发活跃度 主要将用户平时是否有转发习惯考虑在内,有 些用户偏向于发原创微博,很少去转发;有的用户目 的是获取信息,偏爱于浏览他人的微博,而不喜欢发 表或转发微博;还有的用户为了吸引粉丝,热衷于转 发各种微博,即使是自己不喜欢的内容,也不遗余力 的进行转发。显然,用户的行为特征会影响用户的 转发行为。高转发频率的用户对于微博信息的扩散 具有比较强的推动作用。针对这个现象,我们用以 下定义来表示用户的转发活跃度。 定义3转发活跃度。获取一段时问t内,用户 发布总微博数,用5表示,包括用户的原创微博数 和转发微博数,其中,原创微博数用R。表示,转发 微博数用R 表示。用户的转发活跃度R (Retweet activity)表示如下: R R —aR—+R一Lz), 、 or S ・ 根据上述定义,计算出用户产生转发行为和没有产 生转发行为之前的转发活跃度,然后采用Spearman 相关系数_l 进行分析,可以看出用户转发活跃度对 于用户的行为有一定影响,说明之前转发活跃度大 第6期 刘 敏,等:社交网络中微博用户行为的分析与预测 789 的人,在面对一条微博的时候较容易产生转发行为。 兴趣,交互越频繁,说明越感兴趣,越容易产生转发 表3 用户的转发活跃度与用户行为的相关性 Table 3 Spearman’S rho between Retweet activity and User’S behavior Term Index Retweet User’S actlwty behavior CorrelRetweet Coeffiatieienton  1.000 0.386 actwltv Sig.(2-tailed) O.OOO CorrelUset’s Coeffiatieienton  0.386 1.000 behavior Sig.(2一tailed) O.OOO **Correlation is significant at the 0.01 level(2-tailed) 3.2微博特征 微博特征反映了用户发布微博的方式,如微博 中是否包含URLs、Hashtags和@他人,我们分析 数据如表4,给出了微博文本特征对于转发行为和 非转发行为的对比,可以看出URLs、hashtags和@ 他人在统计意义上对用户的转发行为有一定影响。 在涉及@他人的时候,用户会谨慎选择分享与否。 表4微博特征在转发和非转发行为上的对比 Table 4 Comparison between retweet and non—retweet 微博特征 转发行为 非转发行为 包含uRLs比例 22% 16% 包含Hashtags比例 29 13 @他人的比例 25 45 3.3交互特征 3.3.1 接收用户与上层用户的交互程度 微博不同于其他社交网络,在微博中大多数用 户之间是一种单向关系,有可能粉丝对关注的人很 了解,但用户对自己的粉丝却不一定了解,这就反映 出如果用户时常关注某人的微博消息,表示他对这 个人的微博是感兴趣的,之后再出现这个人的消息 时,他也有很大的可能继续关注。因此我们用以下 定义来表示用户之间的交互程度。 定义4用户之间可以通过转发进行交互,假 设 关注了U,在一段时间t内,用户 与 之间的 交互程度(Interactive strength)表示如下: 一 . (3) 式中: 表示一段时间t内用户 转发过用户U的 微博数;_r 表示时间t内用户 发布的微博总数。 根据上述定义,计算出用户产生转发行为和没 有产生转发行为时与上层用户的交互程度,然后进 行Spearman相关性分析得到表5,可以看出用户与 上层用户的交互程度对于用户的行为有很大影响, 用户之间的交互关系体现了用户是否对上游用户感 行为。 表5 用户与上层用户的交互跃度与用户行为的相关性 Table 5 Spearman’S rho between Interactive strength and Use’S behavior Term Index Interactive User’s strength behavior CorrelatInteractive Coeffieiention  1.000 0.435 strength Sig.(2-tailed) 0.000 Correlation User’S Coefficient 0.435 1.000 behavior Sig.(2-tailed) 0.000 3.3.2微博内容与接收用户兴趣相似度 该因素考虑的是用户的兴趣,直观上认为人们 偏向于关注自己喜欢的话题,进而,与用户兴趣相似 的话题也更容易得到用户的转发 。但是用户的兴 趣可能会随着时间、年龄的改变而改变,因此在验证 微博内容对用户转发行为是否有影响的时候,重点 考虑用户近期的兴趣,这样既可以保证预测的准确 性,又避免了大量的计算工作。 要计算文本的相似性,信息处理过程如下: 1)对用户产生分享行为的微博内容进行处理, 使用中科院计算技术研究所研发的汉语词法分析系 统(ICTCLAS) 进行分词。为了更好的计算相似 度,进行停用词处理,即把汉语中的语气词、副词、介 词、连词(如“我”“是”“啊”之类的词)等作为停用词。 2)提取用户最近一个月的兴趣空间,假设用户 最近发表了 条消息(包括原始和转发),消息集合 M一{m ,mz,…,m ),进行如同1)中的分词处理。 3)将处理后的微博内容信息和用户兴趣的关 键词结合构成文本的特征向量W==:(W ,W。,…, W )和用户的兴趣向量W 一(W ,w ,…,w )。 4)对向量w和w 中的每个词语计算其权重 TF—IDF(TermFrequency—Inverse Document Fre— quency)值,用来表示微博的重要性。计算完成后w 和w 向量分别为T一(T ,T ,…,T )和T,一(T , T ,…,Tft)。 T (1≤ ≤ )计算方法为: T —F ×F¨D一 ×log(M/m). (4) 设 为词项w 在这个微博中出现的次数,M 为微博文本的总数,m为其它所有文本中包含词语 W 的微博数。同样可以计算用户兴趣向量 一 (T 1,T 2,…,T )。 5)当前计算文本相似度的方法很多,我们采用 余弦系数来计算当前微博内容和用户兴趣向量的相 79O 太原理工大学学报 第47卷 似度,越接近1相似度越高,计算方法如下: 间也可以有关系(这里只考虑用户之间的相互关注 关系),那么用户所处的局部结构会对用户产生什么 影响呢,这是我们这节所要探究的。 3.4.1朋友节点的影响 ∑T ×T Sie(丁,T )一—=兰兰=——_==rn , n . (5) /∑T ×^/∑ 根据上述方法分析得图3,可以看出微博内容与 接受用户的相似度越高用户越容易产生转发行为,相 在微博消息传播网络中,用户具有一定的趋同 性,当周围朋友都转发某条消息时,用户对该条消息 也会产生兴趣,进而产生转发行为。可以认为在消 息传播过程中,用户会受到朋友节点个数的影响。 似度在0.4以后明显看出用户喜欢关注与自己的兴 趣相关的微博;可以看到当相似度很小的时候,用户 通过统计分析得到如图5,再经过计算我们发现在 也有一定的概率转发,说明用户具有猎奇心理。但大 部分时候还是会分享和自己兴趣相符的微博。 0.1 0.O8 褂0.06 辩0.04 0.O2 O O O.2 0.4 0.6 0.8 l 微博内容与用户兴趣相似度 图3兴趣相似的比例 Fig.3 The proportion of similar interest 3.4 结构特征 现实生活中,人们容易受到周围人的影响l_1 , 在社交网络中也一样,身处于不同朋友之间,久而久 之会受到朋友的影响。假设图4是微博网络,对于 ( A ( A F F (a)7个活跃的朋友属于5个朋友组; (b)7个活跃的朋友属于4个朋友组; (c)7个活跃的朋友属于3个朋友组; (d)7个活跃的朋友属于2个朋友组 图4用户所处局部结构 Fig.4 The local structures of user 某条微博 ,用户 有7个朋友(A,B,C,D,E,F, G)都转发了,但是从图4(a)一(d)来看,朋友节点之 被激活两次以后更容易产生转发行为,验证了BAO et al[¨ 的实验。 撒括次数 图5基于受激活次数的转发用户数曲线 Fig.5 The curves between activation number and retweet user number 3.4.2结构的多样性 观察图4用户 有7个朋友转发了消息 ,但 是根据关系网络,不同的关系构成的朋友组是不一 样的,如图4(a)一(d),朋友之间有关系和没关系构成 的网络结构是不一样的,根据上一个因素的分析结 果,我们发现当活跃朋友有0~6个的时候,产生的 转发行为比例就已经达到了96 以上,故在分析用 户的活跃朋友节点所在局部结构的时候,只分析了 拥有2~6个活跃朋友的转发用户,得到如图6。可 以看出产生转发行为中,在活跃朋友数一定的情况 O・8 O7 ; 1 :::2 ac tiv e  ne ig hb o: O.6 l l _1}I÷如  一6— 一…一:卜 一一4  aaCc clttii…Vvvee   “nn… eeiigg k  rhlkUbU^o I r  0 5 丑妻0.4 / 7 .} / 0.3 | ≯f  7 f ./‘ 0_2 f/ ./ O-l l  .| 0 。  .l 2 3 4 5 6 朋友组数 图6结构多样性的影响 Fig.6 The influence of structure diversity 下,随着朋友组增多转发行为所占比例呈现出上升 第6期 刘 敏,等:社交网络中微博用户行为的分析与预测 791 趋势;还可以看出当用户有2~4个邻居节点已经转 发过某条消息的时候,容易产生转发行为;当用户周 围激活的朋友达到一定上限的时候,朋友所在的组 准率、召回率、F1度量值来对结果进行度量。在实际 转发行为这一类中,查准率P(Precision),召回率R (Recal1),F1度量值,准确度A(Accuracy)定义如下: P= , 数多少对于用户产生转发行为影响不大。 除了上述一些特征以外,我们还考虑了一些经 常被传统方法用来进行转发预测的特征,如用户的 粉丝数、用户的认证状态(O表示经过认证,1表示没 R一 F 一 2PR , , (8) (9) 有认证)、用户历史博文数、用户的相互关注数等。 4 转发行为预测 将数据用于训练模型之前,为了保证模型的训 练和收敛速度[1 ,先对数据进行预处理,利用Min- 4.2.2A一 高 转发行为预测结果 . (1O) 转发行为的预测结果如表6所示,可以看出,不 同的预测方法预测效果不一样,使用逻辑回归方法 对转发行为进行预测的查准率达到73.45%,召回 率是79.67 ,预测效果最好。 表6转发行为预测结果 Table 6 Results of Retweet Behavior Prediction max方式进行归一化,使得原始数据映射成[O,1] 之间的新值,归一化方法如下: Y= ===—二 —3gmax—Xmin . . (6)Lb  式中:z,Y分别代表原始数据和新数据;z 表示样 本中的最小值;z 表示样本中的最大值。 4.1 实验设置 分类方法 Logistic Regression Naive Bayes SVM 查准率 73.45 71.32 7l_59 召回率 F1度量值 准确率 79.67 75.26 73.52 76.43 73.23 72.54 73.26 72.63 71.74 1)通过对特征值进行归一化以后,本节利用机 器学习的分类算法对用户的转发行为进行预测,实 验结果采用十次交叉验证(1O-fold cross valida- tion)。 C4.5 Decision Trees 69.15 70.18 69.66 69.85 5 结束语 本文主要研究新浪微博网络中消息传播预测问 2)分类方法的选择。为了获得理想的分类结 果,本文选择多种预测模型进行转发行为预测,包括 Logistic Regression,Naive Bayes,Suppo ̄Vector Ma— 题,用户的转发行为是消息得以传播的基础,首先我 们考虑了若干与用户转发行为有关的四个方面的特 征,包括用户特征、微博特征、交互特征和结构特征, chine(svM)和C4.5 Decision Trees等方法。其中 SVM模型,我们使用实现SVM功能的集成模块 LibSVM,其中核函数选用Radial Basis Function 总共9个因素,并验证了各个因素对转发行为产生 的影响,然后加上一些基本特征,利用机器学习中常 (RBF)。选RBF当核函数的原因是不同于线性核函 数,它可以将非线性映射到高维的空间。此外,RBF 用的四种分类方法预测用户是否对给定的微博产生 分享行为,实验表明逻辑回归的预测效果最好,准确 的参数很少,因此可以降低模型的复杂度[1 。。。 4.2实验结果和分析 4.2.1 评价指标 性达到76.43 。后续本文将继续获取更加丰富的 特征,用来提高预测的准确性,并通过研究用户的转 发行为来进一步探究微博的传播影响力。 实验结果采用十次交叉验证(10一fold cross vali— dation)。为了评价预测模型的好坏,本文通过计算查 参考文献: Eli ELLISON N B.Social network sites:definition,history,and scholarship[J].Journal of Computer-Mediated Communication, 2007,13(1):210—230. [2] Lu x J,Yu z W,GUO B,et a1.Modeling andpredicting the re—post behavior in sina weibo in Green Computingand Communi。 cations(GreenCom)Ec]}}IEEE.IEEE International Conference on andlEEE Cyber,Physical and Social Computing,2013 962—969. [3]LERMAN K,AND GHOSH R.Information contagion:an empirical study of the spread of news on digg and twitter social net。 works[C]??In ICWSM,2010 90—97. 792 太原理工大学学报 第47卷 [4] BOLLEN J.MAO H。PEPE A Determining the public mood state by analysis of microblogging posts[el? M1T.Proceedings of the Alife XII Conference,2010.  P.et a1.Want to be Retweeted?Large scale analytics on factors impacting retweet in twitter net~ [5] SUH B。HONG L.PIROLLIwork[C]f?IEEE Proceedings of the IEEE International Conference on Social Computing SncialCom,Palo Alto,USA,2O10: 177—184. [6] 张呖,路荣,杨青.微博客中转发行为的预测研究[J].中文信息学报,2012,26(4):109 114. [7] ZAMAN T R.HERBRICH R. GAEI J,et a1.Predicting information spreading in Twitter[C]/f Proceedings of the Neu— ral Information Processing Systems,Vancouver,Canada,2010。104(45):598—601. [8] WEBBERI EY W,ALLEN S,WHITAKER R.Retweeting:a study of message—forwarding in twitter[C]∥IEEE.2011 work~ shop on Moblie and Online Social Networks,Milan,2011:13—18. [9] ZHANG J,IAU B,TANG J,et a1.Social influence locality for modeling retweeting behaviorsl c]//Proceedings of the 23rd In— ternational Joint Conference on Artificial Intelligence(IJCA1),2013:276卜2767. [1o] UGANDER J,BAcKsT0RM L,MARI OW C,et a1.Structural Diversity in social contagion[J].Proc Natl Acad Sei USA, 2O12。109(16):5962-5966. [i1] NARAYANAM R.NARAHARI Y.A shapley value—based approach to discover influential nodes in social networks[J]. IEEE Trans on Automation Science and Engineering,2011,20(1):130 147. ER C,DENOYER L,GAUSSIER E,et a1.Predicting information diffusion in social networks using content and user’ [I2] LAGNIs profiles[J].Advances in Information Retrieval,2013,(74):85. [13] BAKSHY E,HOFMAN M,MASON W A,et al,Everyone1 s an influencertquantifying influence on twitter[C]jj Proceed ings of the 4th ACM International Conference on Web Search and Data Mining.Hong Kong,China,2011:65 74. [I4] PAGE L,BRIN S,MOTWANI R,et a1.The PageRank citation ranking:bring order to the Web[R].Stanford University Technical Report SIDL—WP一1999—0120,1999. [15] JERR0LD H ZAR.Significance testing of the spearman rank correlation coefficient[J].Journal of the American Statistical Association,l972,67(339):578—58O. [16] SETH A MYERS,ZHU c G,LECKOVEC J.Information diffusion and external influence in networks[(.;]//Proceeding of KDD’,2O12,l2:33 4l_ [I7] BAO P,SHEN H W,CHEN W,et a1.Cumulative effect in information diffusion:a compreht nsive empirical study on microb logging network.arXiv preprint,arXiv:1306.0196[cs.S1].2013 [18] JIYI W,JIANLIN Z,TONG W,et a1.Study onRedundant strategies in peer to peer cloud storage systems[J].Applied Math ematics&Information Sciences,20l1,5(2):235-242. [19] Boser B E,GUYON I M,Vapnik V N.A trainingalgorithm for optimal margin classifiers[M]∥The Fifth Annual Workshop on Computational LearningTheory.New York:ACM Press,1992:144—152. [2O] JAYADCVA R,KHEMCHANDANI S C.Twin supportvector machines for pattern c1assmcati。n[J].IEEE Trans On Pat tern Analysis and Machine Intelligence,2007,29(5):905—910. (编辑:贾丽红) 

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- axer.cn 版权所有 湘ICP备2023022495号-12

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务