谁有叶荣添新浪博客微博博多帐号管理软件

[中文博客群-博客信息]
欢迎来到中文群!在这里您可以展示您的博客,与"臭味相投"的"狐朋狗友"一起交流成长!我们的口号是"博客?分享?交流?成长"。
本站收录文章数量
推荐用户数
上次登陆时间
最近发表文章
友情链接:
有问题加百度Hi群:1085213 或者 QQ群: ①:满 ③: ④: ⑤: ⑥: ⑦:
中文博客群 版权所有,未经授权禁止复制或建立镜像。
| 联系我们: |青青子衿, 悠悠我心, 但为君故, 沉吟至今
微博营销分析—后宫优雅事件
  网络营销的方法和案例非常多,我先前曾经写过很多过于微博客网络营销方面的文章,在较为浮躁的中国互联网环境下,一个好的创意是网络营销活动中最主要的灵魂。去年的&贾君鹏事件&就是一个非常好的创意,也用事实说明了事件营销的效果和所产生的推动力,往往比其他营销方法要好的多。今天我就具体以最近发生的一起事件营销&&为例,来分析一下在社会化网络环境下的微博事件营销的过程和方法。  2009年12月中旬,新浪微博上出现的一位网名为&后宫优雅&的女子。该女子自称拥有私家飞机,自曝曾送车给张杰、帮俞灏明移民,周末跟李亚鹏一起打高尔夫,总之,&后宫优雅&平日的生活与不少娱乐圈红人息息相关。总而言之,满嘴跑火车,看起来极不靠谱。  事件营销策划  经过我的观察,这是一场精心策划的微博事件营销。事件营销就是通过制造具有新闻价值的事件,并让这一新闻事件得以传播,来转弯抹角的做广告,达到广告的效果。比如某公司要推广某一款网络游戏,使用知名度高的明星代言往往需要较高的费用,推广时候的广告费也不菲,而如果通过事件营销的方式打造一个知名度很高的网络红人来代言这个网络游戏,不仅仅可以节省大量费用,还以低廉的成本进行了网络推广营销。  营销策划人可谓用心良苦,从2009年12月就开始计划利用互联网来打造这个具有较高知名度的&网络红人&&&后宫优雅&。这个案例的营销平台选择的是&新浪微博&,新浪微博是一个2009年后半年开始逐渐热闹起来的社会化网络平台,当时注册用户约有几十万,有不少&名人&入驻。由于网络的虚拟性和匿名性,注册的微博用户背后的身份往往无从知晓,于是做好几方面准备之后就可以开始进行事件营销。  事先的准备工作包括,寻找一个虚拟的&网络美女&,并预备几十张左右的自拍照片,然后寻找一个写作团队,能够持续地写出有趣的段子。准备好这一切后,就可以开微博帐号进行炒作。微博前期的炒作主要以&美女&、&炫富&、&明星八卦&为着重点,总而言之就是&找骂贴&。典型的症状包括,自称来自&新加坡&,&后宫三千,独我优雅&。号称有私人飞机,认识很多明星,和阿娇去日本泡温泉,被范冰冰专门因为安慰过,经常行来于夏威夷、香港等地,投资几千万给电影《阿凡达》,并与许多大牌娱乐圈艺人私交甚好等等。  值得一提的是,该微博的写作团队具有较高的文案写作水准,在初期炒作阶段,发表的段子非常诙谐幽默,颇具有娱乐效果,可读性很高,使得不少新浪微博的名人都转发其段子,在12月中旬时,&后宫优雅&具有了约四千左右的粉丝数。  平媒介入  12月下旬,平面媒体、报刊杂志开始报道和炒作&优雅女&,使得&后宫优雅&的知名度急剧上升,并在日达到了一个,用户关注度增长惊人,搜索量也开始猛增,也开始有网友对其进行人肉搜索,&后宫优雅&的微博在29日粉丝数增长到八千多。经过人肉搜索,网友发现&优雅女&的身份真实性存在很大疑问,有人称其照片为盗用他人照片,而&优雅女&则发帖称自己的相册被盗了。华西都市报的报道  围观吹牛  &优雅女&的写作继续着,满嘴跑火车,很多人发现其照片和自爆的身份故事有着很大的漏洞,即使如此,&后宫&写的段子的确非常有趣,看看那些经典的评论也很快乐的,大家一起围观&优雅女&天马行空地在新浪微博上窜下跳,也好不热闹。  平面媒体的报道不断增多,并在日形成了又一次高潮,当日&后宫优雅&的粉丝数超过2万5千,由于粉丝数增长过快,并且其&后台&不明,很多新浪微博用户都质疑是否新浪官方在策划炒作&后宫优雅&,以增加新浪微博的知名度。后宫优雅粉丝数统计  意外发生  所谓&人算不如天算&,每个营销计划都可能会有意外情况发生,正在平面媒体和网络媒体有条不紊地相互跟进炒作的时候,一个意想不到的事件打乱了这个计划,1月12日突发的&&和之后的&&等热点新闻迅速转移了大众的焦点,新浪微博用户的兴趣也全都集中到百度和谷歌身上,从百度指数上看,1月中旬&后宫优雅&的用户关注度不断下降,媒体关注度几乎为0,使得这次本来计划顺利的事件营销出现了转折。&后宫优雅&的用户关注度统计数据  为了扭转不利局面,同时消除前期炒作的一些不利&证据&,策划人决定也利用百度被黑的热点效应,东施效颦,在1月14日,让&后宫优雅&自称微博遭到&黑客袭击&,并删除了所有先前发布的四十多篇文章,但事实证明这种做法收效甚微。后宫优雅微博数统计  事件营销结束  &优雅女&后期的写作趣味性降低了不少,YY的味道越来越浓,而围观的网友不断人肉搜索,也让后宫优雅从后台走向前台。在1月29日,&后宫优雅&终于露出了庐山真面目,声称要代言完美时空的网络游戏《降龙之剑》,同时停止更新围脖,整个事件营销算是告一段落。  营销效果评价  &优雅女&属于微博客营销的典型案例,策划人一开始是按照传统的论坛、博客等营销策略入手的,就像曾经风靡博客界的&视频舞女木木的身体日记&一样,写一个段子再发张照片,通过炫富和晒明星两大法宝,并自创&后宫体&的写作方法,在新浪微博中获得普遍关注。  &后宫优雅&从日注册帐号,到日营销结束,通过两个月的时间,获得了五万个新浪微博粉丝数,每篇微博的评论数都过千,成为新浪草根博客第二名和网络红人,并获得了黄健翔、潘石屹、宁财神等诸多名人的关注,可算颇有收获。  在营销效果看,经过两个月时间的炒作,&优雅女&的人气急升,在Google搜索&后宫优雅&有21万条记录,搜索&优雅女&有14万条记录,由于新浪微博没有提供点击数字的统计,因此无法确认总点击量,其他数据统计上看,拥有5万5千多粉丝,平均每篇文章留言数1千多,从留言数字上看,大约为拥有数十万粉丝的赵薇、周笔畅的1/3左右,也有足够的知名度,可见其活跃粉丝众多。关注度分析数据上看,其关注人群也大部分属于网游群体的目标区域。后宫优雅关注度分地区和人群分析  但是需要注意的是,从粉丝的留言评论上可以看出,大多数评论都是较为负面的评论,而针对&降龙之剑&的关键字进行分析,发现该网游的关注度并没有因为&优雅女&的火爆而急升,其关注度一直较为平稳,用户关注度甚至还低于&后宫优雅&的关注度,营销效果并不明显。&后宫优雅&和&降龙之剑&的关注度对比  相比之下,2009年事件营销的经典案例&贾君鹏事件&中,营销过程中&魔兽世界&的最高用户关注度几乎增加了三倍,其间媒体关注度也有大幅增加,相对于魔兽世界这样的知名品牌,其营销效果之成功是显而易见的。&贾君鹏事件&中&魔兽世界&的关注度对比  因此,&后宫优雅&的事件营销虽然火了&优雅女&,在短短两个月时间打造了一个&网络红人&,但对于该网络游戏的推广是否有效还有待商榷。该事件营销选择的平台是社会化网络新浪微博,虽然更新较为方便,转发和评论也容易,但由于&优雅女&的定位与网络游戏的切入点都是很难找到契合,同时新浪微博中存在大量高端用户和社会名人,也包括月光博客这样的深度,导致营销事件的后期漏洞百出,影响了传播的效果,虽然游戏的最终用户&&青少年玩家&可能不会想那么多事情,也不会在乎其真假,但是如果选择较为纯粹的草根社区,例如QQ空间或者天涯社区等,则可能不至于像现在这样过早谢幕。  综上所述,&后宫优雅&的微博事件营销策划并像常规的社会化营销方式,属于类似传统的论坛博客炒作方式,目前还无法统计出该事件对网游的营销效果,其最终效果还要等待一段时间才能确认,企业如果真的需要进行长期的微博营销,不建议参考这个案例进行策划,否则有可能会弄巧成拙。  名词解释:&贾君鹏事件&&贾君鹏事件是指日发生的空帖莫名爆红现象。当日百度贴吧魔兽世界吧中,一篇题为&贾君鹏你妈妈喊你回家吃饭&的无内容帖被回复30余万次,该帖名称旋即成为中国大陆网络流行语,贾君鹏这个真实身份不明的人物也随之走红网络,并引发众多后续评论和效应。  参考文章:月光博客企业营销推广系列文章:        
  除非注明,文章均为原创,转载请以链接形式标明本文地址
  本文地址:
案例分析的很透彻,效果和目标不一致确实是营销策划的一大败笔啊
.yuanzhang
优雅后期的写作水平确实太差了。。不过优雅不更新了,还是感觉很遗憾。。还有,以我混w o w吧的经验,贾君鹏事件肯定不是某个团队炒 作出来的,而是广大的w o w e r的功劳
.深圳蚂蚁搬家
分析的很好,学习了,什么时候我的有这么好
Google Reader 用不了了,估计是被墙了
.xuezhongsu
这个Z-blog的留言回复功能我喜欢,比wordpress的功能要好。
美女,好漂亮哦,哈哈爱好者博客 于
23:55:24 回复都喜欢拿女人开刀。
说起来就起来,厉害啊
你不在这里说我根本不知道有么一件东西,恶俗的东西我从来不看的。
.Zenoven自由人
现在啊。。。网上的大部分都是炒作估计。。。
哈哈,又是微博来看看嘛!
后宫优雅这事我有听说,现在的孩子啊……都是这样
Feed怎么只到28号就没有了?william 于
12:24:46 回复你用哪个feed?
更新围脖,整个事件营销算是告一段落。
看来Yocca的文章很好奇,过来瞧瞧。
微博营销的手段真是多种多样~~~推荐一款软件【微博精准流量大师】~做微博推广不错~
MM可以啊,文章的分析思路值得学习另外从文中可以看到非常多现实的缩影
.joycelian
我很关注分析图表的数据是怎么得出的。。
此篇也是营销方式之一,本来都懒得说的,既然发在月光博客,就捧个场吧
看了她的页面(我都不确定是否真的是女的),看了头几条就不想看,遂没去关注
.易推微博助手
很不错的微博营销!
我过时了没有听过她的大名~
没听过这个名字,月光也算在这里给大家普及了,算不算是推波助澜,哈哈~
有没有比较成功的非恶性炒作的微博营销案例?这个案例有些惟利是图、不择手段的感觉。
非常喜欢看月光的博客。恩,这个说分析的灰尘8错了,最近发现一个“ 发传单觅男友 非清华北大硕士不嫁”youku的视频,也是新民网一大杰作。也是通过SNS结合web2.0的创举。
月光,我想做一个个人独立博客,主要运用于个人学习,朋友互动交流。因为我不是学网络这的,自己也不知道怎么做才好。所以想在大体风格上模仿你。不知道是否会同意?网游博客 于
13:20:27 回复z-blog程序,至于模版相似没什么大碍的吧爱好者博客 于
23:57:12 回复很多人用月光的模板呀,没事,用就用吧。模板是公开的。
这篇文章很有可能吧味道。
怎么看怎么像新浪微博的话题广告,只是比较隐蔽而已
月光兄要是开一个论坛,那就热闹了
完美时空的炒作
.追风筝的人
我也没听说过!GOOGLE热榜都没看到过!
在新浪微博首页经常看到
个人比较方案这类营销手段
话说那段时间经关注百度google来着,根本不知道这个人和这款游戏。conandj 于
16:59:14 回复......我也是俄。。。。。。
如果能够营销到twitter上就算牛了,这种新浪微博的影响力比较弱。
宣传的非常好!
说的有道理 。。。
分析流畅,无障碍看完,发现果然不是简哲写的
所以现在当一个事情热起来,都无法分清是真是假了。
月光不提 根本不知道有这事...
这女的长得一般
这营销手段厉害啊
月光也来娱乐一吧,现在全民娱乐的精神很好啊
炒作出来的东西,很快就被埋没的
能利用微博炒作到这个地步,算是很厉害的了。佩服下
博主可以告知“后宫优雅粉丝数统计”这张图上面显示的结果是在哪儿查询的吗,是否有这样的工具呢,谢谢!
这个有意思这个有意思
我是一名大学生,请问你上面的那个粉丝总数以及微博总数是通过哪里形成的表格
我怎么看着像是裸女打麻将上得 图片的
你的胸也没像小河北说的那么小啊 比旺仔小馒头还是大点的
不知道会玩这款游戏的人有多少
但确定有很多人因此而知道了这款游戏!
罘好。。。下次再来看
很好噢,主人很漂亮。。。
傻B 2B.....................
文章不错,美女也挺好看的。
新浪微薄和他应该是有合作关系的!
在twitter上应该不可能出现这种情况,毕竟墙已经成了twitter中文用户的一个天然脑残过滤器
月光老兄的新浪围脖基本没人跟,悲哀
居然不知道...我落后了..囧大概是因为既不上新浪微博,又不看报纸,加上周围的朋友也不在这个兴趣圈中的原因吧
也包括月光博客这样的深度微博用户哈哈哈。好营销啊。
.songmusic
我看看是什么东西吧
这个女的 漂亮.哈哈
整个案例都分析得很好。我想请教那些数据是利用什么工具得出的,因为最近也在做论文,急用。请月光大侠赐教一条生路。感激涕泗流m(_ _)m
如果此人真是不存在呢?那不是让人觉得渗得慌?
站长,我想请教一下,本文中的流量统计数据是使用的哪个软件,谢谢
我感兴趣的是她的前几篇博文是怎么被大家看到的。新浪微博用户这么多,更新这么快,一个小女孩的博文怎么能一下子被大家看到。我觉得这才是做博客营销最难,也是重点中的重点的地方。
.zhaoniupai
此页PR=4!可惜,nofollow了
其实我觉得事件火红,与新浪的推荐也不无关系。要不突然一个小女生写着这么多天荒夜谈的事情,谁会关注呢?她又不像博主一样有一定的人气基础。所以媒体的配合也是一个重要的点。
分析得蛮有道理的,孤陋寡闻了,可能不怎么玩sina围脖吧,没听说过优雅女,不过女的确实还可以。
.weddingdressshop
炒作,一切都是炒作~
以前微博上有后宫优雅这人。。。
微学堂,微博托管维护,效果外包!
分析的真实透彻啊~~~
好像很有意思,呆会再来看
什么是炒作,炒作就是遛你玩,如果这都可以称得上是营销手段,真是悲哀。
 早先说过“微博的黑名单功能”是个非常有特色的功能,Twitter和新浪微薄都能很好地实现,今天经过实测,在腾讯微博中“拉黑名单”后,对方居然还能继续看到你的更新,不知道腾讯微博是怎么“理解”微博中的“拉黑”功能。  而新浪和Twitter正确的“拉黑”功能应该是:双方自动取消关注,并且对方无法再关注你,也不能给你发评论,私信,通知等功能,如果“拉黑...
这篇文章是月光本人写的吗?williamlong 于
9:37:07 回复是啊,有什么意见吗?zxc 于
10:12:09 回复后宫优雅关注度分地区和人群分析 这张图是怎么分析出来的?piao 于
13:10:06 回复百度指数,谷歌风向标。
没有想到,在这么靠前的位置呢~~~高兴ing
我孤陋寡闻啦,这个女的不认识。
分析的透彻。不错
不得了啊,这些都是网络营销的牛人!
.怎么不让人发表评论
哎,,打消我的积极性,,,不让回帖么?
赞助商广告
本站采用创作共用版权协议, 要求署名、非商业用途和相同方式共享. 转载本站内容必须也遵循“署名-非商业用途-相同方式共享”的创作共用协议.微博和博客的特性比较_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
评价文档:
微博和博客的特性比较
微​博​论​文
阅读已结束,如果下载本文需要使用
想免费下载本文?
你可能喜欢推荐这篇日记的豆列
······
&(43136人关注)
&(9064人关注)
&(790人关注)
&(14503人关注)
&(367人关注)张雨石:微博背后的那些算法 - 博客 - 伯乐在线
& 张雨石:微博背后的那些算法
微博是一个很多人都在用的社交应用。天天刷微博的人每天都会进行着这样几个操作:原创、转发、回复、阅读、关注、@等。其中,前四个是针对短博文,最后的关注和@则针对的是用户之间的关系,关注某个人就意味着你成为他的粉丝,而他成为你的好友;@某个人意味着你想要他看到你的微博信息。
微博被人们认为是“自媒体”,即普通大众分享与本身相关的“新闻”的途径。最近,有些人使用自己在自媒体上的影响力而盈利的报道屡见不鲜。那微博上个人影响力是怎样计算的呢?微博上还有哪些算法作为看不见的手在管理着我们?我们的每一个行为怎样影响着算法呢?
直观上看,微博其实是人类社会的一个简单的缩影,微博网络的一些特点,也许可以启发我们得到真实的社会网络上的规律。得益于社交网络的爆发式发展,“社会计算”尤其是社交网络分析成为数据挖掘的新宠儿。下面我们就针对微博网络分析的一些算法进行简单的介绍,其中的有些算法对于其他的社交应用可能也适用。
微博用户量浩大,不同的人有不同的兴趣。挖掘每个用户的兴趣有助于更加精准的广告投放、内容推荐。为了得到每个用户的兴趣,可以为用户打上标签,每个标签代表用户的一个兴趣,用户可以拥有一个或多个标签。为了得到最终的用户标签,先做第一个假设:
每个用户的好友(或粉丝)中与该用户具有相同兴趣的人占多数。
这就引出了本文介绍的第一个算法,即标签传播算法。在这个算法中,每个用户的标签取其好友或粉丝中标签最多的一个或多个。当然,可以将好友和粉丝的标签都考虑进来,整合的时候可以考虑赋予好友的标签和粉丝的标签不同的权重。标签传播算法的过程如下:
1)对一部分用户给出初始标签;
2)对每一个用户,统计其好友和粉丝的标签数目,赋予该用户出现次数最多的一个或者多个标签。
3)循环进行第2步,直到用户的标签不再发生大的变化为止。
用户相似度计算
标签传播算法实现起来比较简单,其缺点在于当所做的假设不符合事实时,比如为了社交上的礼貌,我们一般会把自己的亲友添加关注,这些人不一定和我们拥有同样的标签;该算法的结果就会变得很差。解决的办法就是通过计算用户之间的相似度来衡量好友或粉丝的标签对用户标签的贡献率。因而得到第二个假设:
与用户越相似的好友或粉丝,其标签越可能是用户的标签。
那么,如何衡量用户之间的相似度呢?这就需要考虑到用户发表的微博信息了,包括转发的和原创的。这里是要考虑用户之间的相似度而不是用户微博之间的相似度,因而在实际计算时,将某个用户的所有微博信息聚集到一起进行计算。一个可选的方法是使用词袋法将微博信息表示成词语向量,然后直接使用余弦方法等计算其相似度。但这个方法太过简单,不容易达到好的结果,这里介绍一种基于LDA(隐含狄利克雷分布)的相似度计算方法。
LDA仍然使用词袋法表示文本,但是在中间添加了一个主题层,形成了“文档-主题-词语”三层概率模型,即每篇文档看成是主题的一种概率分布,主题又被看成是单词的概率分布。在LDA模型下,文档可以被看成按照如下方式生成:
1)对于每篇文档:
2)从主题分布中抽取一个主题;
3)从该主题的词语分布中抽取一个词语;
4)重复第2步和第3步,直到该文档的所有词语都生成。
LDA模型参数的估计算法不在本文的讨论范围之内。这里只需要知道,通过LDA可以得到每个用户的微博信息的主题分布。然后使用余弦方法、KL距离等计算相似度的方法来得到用户间主题分布的相似度,以之作为用户之间的相似度。而后使用该相似度对标签传播进行加权。
时间因素和网络因素
上述的算法还有什么缺点呢?
随着时间的变化,用户的兴趣是会变化的,计算用户相似度的时候每次都把所有微博信息都聚合在一起不太合理。对此,可以通过选取距离当前时间较近的N条微博。比如,对每个用户,选取距离当前时间最近的50条微博聚在一起放到LDA中训练。此处的N既不能太大也不能太小。太大则不容易反映用户兴趣的时间变化,太小则由于用户发表微博的随机性容易引起兴趣的漂移。为了使效果最好,可以不拘泥于一个固定的N,比如可以考虑对每个用户按照其发表微博的时间序列做N值的自适应。
至此,在算法中还没有考虑微博关系中由回复、转发、@等所构成的网络信息。以转发为例,如果在用户的微博中频繁的转发某个好友的微博,那么用户和该好友的相似度相比其他好友来说应该会更高。这里可以看做是假设三:
用户转发某好友的微博的频率越高,用户与该好友的兴趣相似度越大。
相似的,可以得到假设四:
用户微博中@某用户的频率越高,用户与该好友的兴趣相似度越大。
由此就得到了计算相似度的另外的因素。有很多方法可以添加一个新的因素到原有的相似度计算方法中,比如可以考虑将转发频率量化为值,作为权重添加到相似度的衡量中去。
微博社区是指在微博中关系紧密的人组成的团体,社区内部的人之间联系紧密,社区之间的联系则比较稀疏。这里所指的关系紧密有两层含义,第一是社区内部的人之间的兴趣相似度大;第二是指社区内部的人之间的关系要近,比如要求社区内部的两个用户不能超过二度关联,二度关联即好友的好友。
兴趣相似度在上文已有叙述,关系相似度则需要利用用户之间的关注关系来进行计算。以用户的关注关系为单向链,可以将所有的微博用户之间的关系表示为一个巨大的有向图。用户之间的关系相似度可以简单的考虑,比如使用用户间的最短路径的倒数。但是这种方法衡量的不精确,我们知道,在现实世界中,存在着六度理论,在微博网络及其他社交网络中,往往关系会更加紧密。因而这种简单的关系相似度只能有至多六个离散值,显然不够精确。
为了达到更好的效果,这里不仅以最短路径作为显式量度,还要考虑一些隐式的量度。这里先给出两个假设,分别为假设五和假设六:
两个用户的共同好友越多,这两个好友的关系相似度越高。
两个用户的共同粉丝越多,这两个好友的关系相似度越高。
这里可以借鉴Jaccard相似度的计算方式,将这两种假设的量化函数表示为交集的大小与并集的大小之商。以假设五为例,其量化指标又被称为共指向性相似度,量化时使用两个用户共同好友的数目除以两个用户所有好友的数目。假设六的量化指标被称为共被指向性相似度,计算方式与共指向性相似度类似。从意义上讲,这两种相似度不仅仅是关系上的度量,在一定程度上也衡量了用户之间的兴趣相似程度,直观上看,两个用户共同关注的好友越多,他们的兴趣相似程度也越大。这两种相似度还有一个专业的名字,是基于结构情景的相似度计算。
得到了最短路径相似度、共指向性相似度、共被指向性相似度后,可以采用一种加权函数将它们融合起来,得到最后的相似度。之后,可以采用一些聚类算法如K-Means、DBSCAN等进行聚类操作,得到最后的社区簇。也可以采用相似度加权的标签传播算法,把具有相同标签的人作为一个社区。
影响力计算
在社区发现中,使用微博中的关系网络可以提高相似度计算的精确度。但关系网络能做的事情还有很多,影响力计算便是其中比较重要的应用。
说到影响力的计算,这里借鉴了网页排名中的算法。网页排名中广为人知的算法当属PageRank了,该算法由google创始人拉里·佩奇和谢尔盖·布林发明,随着google在商业上的成功而声名鹊起。该算法根据网页之间的链接来确定网页的排名,其核心在于一个假设,质量高的网页所指向的网页的质量必定也高。
根据PageRank的思想,可以得到微博上影响力的假设,称之为假设七:
影响力高的用户关注的用户的影响力必定也高。
将用户看成是PageRank中的网页,将关注关系看做是网页中的链接关系。从而,可以根据PageRank的算法流程得到在微博关注网络上的影响力计算算法:
1)赋予所有用户相同的影响力权重;
2)将每个用户的影响力权重按照其关注的人数等量分配;
3)对每个用户来说,其影响力等于其粉丝分配给他的权重之和;
4)第2步和第3步迭代,直到权重不再发生大的变化为止。
在网页排名中,基于网络关系的算法还有HITS、HillTop算法等,这些算法也可以借鉴到影响力计算中来。
上面的算法有什么缺点呢?
如果只是基于关系网络的话,那么很容易就造成,粉丝数目多的人影响力必然会很高。这样就导致有些用户去购买一些僵尸粉就可以达到很高的影响力了。这样的算法显然是不能应对实际情况的,因为还有太多的信息没有用到。
用户的影响力除了他的微博关系之外,还与他的个人属性有很大的关系,比如用户的活跃度、微文的质量等。用户的活跃度可以使用其发表微博的频度来衡量,微文的质量可以采用其被转发的数目、被回复的数目来得到。通过对这些值进行衡量,再加上上面算法的结果,就可以得到更加精确的影响力结果。
当然,也可以这样考虑,用户之间的回复关系、转发关系、@关系均可以构成网络,它们也有相应的假设,分别为假设八、假设九、假设十:
影响力越高的用户回复的微博的影响力越高,从而使该微博主人的影响力变高。
影响力越高的用户转发的微博的影响力越高,从而使该微博原创作者的影响力变高。
影响力越高的用户倾向于在其微博中@影响力高的用户。
这样就又得到了转发网络、回复网络、@网络三种网络,借鉴PageRank算法,可以得到另外的三种影响力结果。将它们与关系网络的影响力结果进行融合,就可以最终的影响力结果了。这里的融合可以简单的考虑成结果的加权和,复杂的融合方法不在本文的范围之内。
话题因素和领域因素
得到了影响力的计算方法之后,可以做些什么呢?
可以对当前的热点话题进行影响力分析,得到谁在微博上成为当前热点话题的意见领袖。具体做法是这样,找到和当前热点话题相关的微文,从而找到参与当前热点话题的用户。如何找到和当前热点话题相关的微文呢?有话题标签的微文自不必说,对于没有话题标签的微文来说,可以使用上文中介绍的LDA算法,它可以在用户的所有微文中找到用户的主题分布,也可以对一条微文找到主题分布,一般来说,由于微文的字数限制在140以内,比较短,因而一条微文包含的主题数目不会太多,取该微文的主题分布中概率最高的主题当做其主题即可。
找到话题对应的微文与用户之后,运行影响力计算算法,就可以得到该话题中影响力较大的用户了。这也是舆情监测、社会热点监控的一个方面。
对于标签传播算法得到的结果,对同一标签下的用户运行影响力计算算法,可以得到该标签下的影响力排名,即领域内影响力排名。比如,李开复在全部领域内的影响力或许不是最高的,但在IT领域,其影响力绝对是数一数二的。
垃圾用户识别
在影响力计算中,提到要避免僵尸用户对影响力计算的干扰。在算法中,如果可以识别这样的用户,在计算影响力时将其排出在外,不仅可以提高效果,还可以降低计算量。
与影响力计算相似,垃圾用户的识别要同时考虑用户属性与链接关系两方面的因素。
对于垃圾用户来说,有一些统计上的特征与正常用户不同。比如如下几点:
垃圾用户一般发微文具有一定的时间规律性,可以使用熵值对此进行衡量,熵是衡量随机性的一种量度,随机性越大,熵值越小。具体做法为将一定的粒度进行时间切片统计,得到每个时间片内的博文概率,然后依照概率进行熵值的计算。熵值越大代表用户发微文的时间越有规律,越有可能是垃圾用户。
垃圾用户有些倾向于在微文中恶意的@其他人,因而有些垃圾用户的微文中@使用的比例比一般用户高。
有些垃圾用户的微文中为了进行广告的推广,添加大量的URL。可以通过微文中的URL比例进行衡量。也有些用户为了骗取URL的点击,微文中的内容与URL对应界面的内容不一致,这时需要判断微文与URL内容的一致程度,简单的做法可以使用词袋法将微文与URL对应界面表示成词语向量,查看微文中的词语在URL对应网页中出现的频度。
对于那些为做广告推销的用户,还可以对其微文进行文本分类,判断其微文是否是广告,如果某用户的相当一部分微文是广告,则该用户可能是垃圾用户。
垃圾用户一般随意的关注用户,故其粉丝数目与好友数目的比例与正常用户会有差别。而且正常用户一般是通过好友关系添加好友的,这样会形成关注三角形,如A看到其好友B关注了C,那么若A也去关注C,就形成了A关注B、C,B关注C的三角形。一般来说,由于垃圾用户关注的随意性,其关注三角形的比例与正常用户不同。
当然,垃圾用户与正常用户的不同之处不止这些,本文不再一一枚举。垃圾用户的识别本质上是一个二分类问题,获得了这些属性之后,就可以将这些信息输入到一个机器学习的分类模型中,比如逻辑斯蒂回归(LR)、决策树、朴素贝叶斯等,就可以对其进行分类了。
当然,还没有用到链接信息。一般来说,垃圾用户会去关注正常用户,而正常用户不会关注垃圾用户。这即是假设十一:
正常用户不倾向于关注垃圾用户。
这样就可以再次使用PageRank算法来对用户是否是垃圾用户的概率进行计算。这里需要注意的是,算法初始化时采用上面的分类器结果,将垃圾用户的概率设为1,正常用户的概率设为0。在PageRank计算过程中,不能通过简单的求和公式计算,比如如果一个用户关注了多个垃圾用户的时候,求和后概率可能大于1;因而需要使用一些归一化方法或指数族函数进行概率的更新。
本文对微博中常见的问题的对应算法进行了简单的介绍,在实际应用中的算法比介绍的要复杂的多。当然,本文覆盖的主题并不全,比如好友推荐、热点跟踪等就没有涉及到。但古人云“窥一斑而见全豹”,希望本文的介绍能帮助大家更好的理解微博这样的社交网络应用。
在文中,可以看到黑体标出的假设,这些假设看起来都与我们的直观感觉一致。而根据这些可以引申出很多有效的算法。所以有时候,只要你肯发现,算法就在身边。
可能感兴趣的话题
最新评论(期待您也参与评论)
汇集优质的Python技术文章和资源。人生苦短,我用Python!
JavaScript, CSS, HTML5 这里有前端的技术干货!
关注安卓移动开发业界动态,分享技术文章和优秀工具资源。
关注iOS移动开发业界动态,分享技术文章和优秀工具资源。
关于伯乐在线博客
在这个信息爆炸的时代,人们已然被大量、快速并且简短的信息所包围。然而,我们相信:过多“快餐”式的阅读只会令人“虚胖”,缺乏实质的内涵。伯乐在线博客团队正试图以我们微薄的力量,把优秀的原创/译文分享给读者,做一个小而精的精选博客,为“快餐”添加一些“营养”元素。
欢迎关注更多频道
– 分享和发现有价值的内容与观点
– 为IT单身男女服务的征婚传播平台
– 优秀的工具资源导航
– 翻译传播优秀的外文文章
– 国内外的精选博客文章
– JavaScript, HTML5, CSS
– 专注Android技术分享
– 专注iOS技术分享
– 专注Java技术分享
– 专注Python技术分享
(加好友请注明来意)
网站使用问题
请在询问或者反馈
& 2015 伯乐在线
赞助云主机}

我要回帖

更多关于 叶荣添新浪博客微博 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信