betway必威官网注册 > 科学 > 黑客是怎样造成堵车的,功夫在微博之外

原标题:黑客是怎样造成堵车的,功夫在微博之外

浏览次数:150 时间:2019-09-21

日前,一位德国研究人员在欧洲BlackHat大会上演示了黑客是怎样通过影响实时交通流量分析系统来让现实世界中的交通变得混乱的,尤其是在那些有很多人使用谷歌地图或Waze导航系统的地区。

生活在互联网世界的人,都曾或多或少地浏览过在许多国家仍受管制的色情网站。我们很难洞察这类网站的发展状况,因为相关的确切数据实在是少之又少。可以肯定的是,色情网站的访问量肯定少不了。事实证明上述猜测是正确的,因为根据谷歌旗下广告服务商Doubleclick的数据显示,独立访问量前500名的网站中,竟有数十个是成人网站!

网上已经有太多关于怎么增加微博粉丝数,以及怎样让我们发的微博获得更多转发的建议了。我们并不知道这些建议是否有效,因为它们大都是建立在个人感觉上,而缺乏真正有说服力的证据。实际上微博是一个非常适合进行数据分析的东西,所以想谈微博心得,你得用数据说话。

谷歌和Waze都在它们的智能手机应用中提供了导航服务,同时它们也利用来自那些手机的信息进行实时交通状况分析。然而,只要利用软件公司在用户隐私与数据采集这两方面做出的一些折衷设置,黑客们就可以匿名地影响导航软件来让其实时交通分析系统记录一些根本不存在的信息,这样就可以将司机带入歧途,也就可以影响现实中的交通状况,达到“以假堵车造成真堵车”的效果。

世界上最大的色情网站Xvideos每月有44亿的访问量,这个数字是CNN官网或24小时专门播放体育节目ESPN电视网的访问量的3倍,是社交新闻站点Reddit的2倍。YouPorn、Tube8和Pornhub这些大型的色情网站,其访问量也可以让除了Google和Facebook等超大型网站之外的小网站们相形见绌。

一个普通用户的微博数据

从 2012 年 8 月 24 日开始,我像个自恋者一样,每天都看看自己的粉丝数涨了多少——不但看,而且还顺手把数字记录下来。这样坚持到写作本文的时候一共过去了 86 天。这个数据的可贵之处并不在于它是人工测量的,而在于它是独一无二的:由于不管是新浪微博还是 Twitter 都不记录,或者至少是不提供“关注”这个动作的发生时间。现有的任何微博相关数据研究也都没有精确的粉丝数随时间变化记录。如果能得到更多像这样的数据,我们完全可以写一篇像本文后面要介绍的那两篇一样重要的论文。

下面这张图就是我在这86天中粉丝的增长情况。上图是总的粉丝数,下图是每天增加的粉丝数。

图片 1

我曾经设想,一个人粉丝的增加应该是指数增长的:关注你的人越多,你的影响力就越大,那么就会使得有更多人来关注你。这样的微分方程是 df/dt = cf,所以 f = e ct 。然而实际上的增长却大致是线性的,df/dt=常数!除了几次突然爆发之外,我大概每天增加 10 个粉丝。图中用数字标记了 4 个突然增长事件,其中 9 月 15 日 和 10 月 22 日这两次比较大。不算突发事件,我的增长速度相当稳定:图中两段近似直线中,第一段平均每天增加粉丝 9.2 个,第二段平均每天 10.5 个,这还包括了(2)和(3)两次小跳跃。如果真有指数增长,那么或者发生在账户开通的初期,或者要等到账户已经相当有知名度之后,或者本身是个极大尺度的现象难以在这么短的时间内表现。

所以如果你认为增加粉丝的最好办法是多发好的微博,结果可能会让你失望。事实是只有出 现爆发事件才能让你的粉丝数上个台阶 。在图中标记的四个爆发事件中:

(1)是我在果壳网发表了 近亲不如远邻:最关键的人脉是不熟的朋友 。我 9 月 15 日的相关微博被转发超过一千次,而更重要的是 @果壳网(粉丝 60 万)在微博对此文进行了介绍,结果是一天之内增长了 300 多个粉丝。

(2)这个小波动发生在 9 月 23 日,而我从 9 月 16 日到 24 日间一条微博都没发过。我不知道这是什么原因,很可能是(1)的一个余波。

(3)是我在博客发了《一个关于转世的流行病学研究》一文。从粉丝的增长情况来看这篇文章的影响力不大。此后在《上海书评》发表《四万年来谁著史》,仍然没有带来多少粉丝。

(4)是 @cnsns (粉丝3万多)在微博对我进行了 推荐 ,而这条推荐又被 @经纬张颖 (粉丝342万)转发,导致粉丝数在 33 分钟内增加了 321 个,两天增加了 800 多。

我在三个月内发了大概上百条微博。发微博对当天增加粉丝有一定的影响,但是在绝大多数情况下不会带来什么爆发。由此可见增加微博粉丝数的最好办根本不是发微博,发微博还不如少发几条微博写篇正经文章。当然最有效的办法也不是写文章,而是被大V推荐。这里没有记录到的是在我微博账号建立的初期也曾有过一次爆发,是媒体人土摩托(粉丝14万)和松鼠科学会成员等科学作者的推荐导致。

汉堡科技大学分布式应用安全研究所的博士生托比亚斯·杰斯克(Tobias Jeske)说:“你不需要任何特殊设备就能实现这一切,而且可以在全球范围内操纵交通数据。”

从访问量中,我们只能得出色情网站要比非色情网站更受欢迎这个结论。40亿访问量听起来确实是个天文数字,但是当你将用户在色情网站上做的事考虑在内,你就会发现,色情网站的大小和规模也不可小觑。

来自名人的大数据

没有多少人会像我一样每天记录自己的粉丝数,这使得大规模研究微博账户的成长过程非常困难。但是卡耐基梅隆大学和微软的研究人员仍然 想了一个没有办法的办法 。Twitter跟新浪微博一样,虽然不记录每个“关注动作”的发生时间,但它把你所有的粉丝按照关注你的先后顺序排列。同时,Twitter还提供每个账号的首次注册时间。这样对其中任何一个粉丝,研究人员找到他的注册时间,并且找到在他之前关注你的所有粉丝的注册时间,然后把所有这些时间中最晚的那个,就当成他这次关注发生的时间。可以想象这是一个非常不精确的估计,但只要数据量足够大,仍然是可以接受的。

这篇文章发现, 哪怕对于具有相当量级的名人来说 ,“被推荐”仍然是最重要的增长粉丝办法。下面这张图表现了技术博客 Anil Dash,娱乐界女星 Kim Kardashian 和纽约时报的 Twitter 账户被关注的时间曲线。他们粉丝的增长充满了突变,而其中最大的几次突变,正是因为 Twitter 对他们进行了系统推荐。

图片 2

图中事件(1)是 Twitter 引入了一个系统推荐名单,而纽约时报在这张名单上。我们看到这个名单一出来,纽约时报每天增加的粉丝数立即提升了一个层次。到 2009 年 4 月,Kardashian也被加入到这份名单之中,于是她的粉丝数也开始暴涨。没进推荐名单之前,Dash的粉丝数每天增加 50 个,等到十月份被加进推荐名单之后,他的粉丝数每天增加 2500 个!一个有意思的现象是 Dash 进来之后纽约时报和 Kardashian 的成长开始放缓,研究者也不确定这是怎么回事。根据后面的变化推断,对纽约时报来说,很可能是因为 Twitter 在十月份扩大了推荐名单上的人数,使得它的重要性被稀释。而对 Kardashian 来说,则可能是她被从推荐名单上移除了。

事件(2)是 Twitter 改变了推荐方式,把推荐账户分类,让用户自己根据兴趣选择。这个变化对 Dash 和纽约时报带来了一个打击,二者每天增加粉丝数都显著减少。但 Kardashian 因为早已不在推荐名单上,她的成长没有受到影响,仍然逐步增加,甚至有点指数增长的意思。

事件(3)是 Twitter 再次改变推荐方式,变成根据每个用户的兴趣来定制推荐。这一次纽约时报和 Kardashian 都受益了,而 Dash 受到的影响不大,仍然每天增加200左右的粉丝。

仅从这张图而论,系统推荐的作用实在是太大了。技术博客 Dash 和纽约时报的粉丝层长几乎完全由系统决定,只有像 Kardashian 这样的女明星才能跑出一段不顾大盘的强势增长—— 据说 请她发一条广告微博的价格是一万美元。那这些明星们的增长靠的又是什么?得看下面这张图:

图片 3

像 Oprah Winfrey 这样的大佬一在 Twitter 现身(事件1),马上就有了众多粉丝,但是最初的高潮之后加粉的速度却越来越放缓,变成跟 Ashton Kutcher 差不多的趋势。真正能做到加粉速度越来越快,好像指数增长一样的是 Lady Gaga 和 Justin Bieber 这样的偶像派!他们的粉丝是怎么来的?是因为他们发了高质量微博吗?当然不是。

这两人的粉丝成长,是他们在现实生活中事业成长的反应 。Justin Bieber 在2009年初还是个无名之辈,Lady Gaga 2010 年后才大红大紫。我们看 Lady Gaga 的几个关键事件,(2)是她得了 MTV 的音乐奖,(3)是她参演了艾美奖,(4)是她出了新MV“Telephone”。图中事件(5)很有意思,是明星 Soulja Boy 突然删除自己原有的Twitter账号又建了个新的,粉丝们忙着关注他的新账号,一时之间产生了大量的关注动作,以至于我们图上这几位明星的 relative popularity 都被抢了风头。

这样看来非常明显,哪怕是对名人而言,也是系统推荐的力量最强,其次则是看你在现实世界干了什么。明星们微博粉丝的变化很可能与他们发什么微博关系不大。在新浪微博姚晨的粉丝最多(现在已经是谢娜了),但姚晨却未必是中国最火的女明星,据此可以推测是新浪的推荐帮了大忙。

而对于我们普通人来说,既没机会被系统看上,也没机会在真实世界兴风作浪,想要涨粉丝也许只能靠发几条有意思的微博。我们期待这些微博能被广泛转发,因为只有这样才能被更多人看到,引来新粉丝。但是怎样获得更多转发?更重要的是,转发真有用么?

他还表示,除了GPS,谷歌和Waze都可以利用Wi-Fi来进行定位。不过如果仅仅开启了Wi-Fi,就只会传输周围区域内无线接入点和无线小区的信息,这使得导航系统只能粗略估计用户位置。

网站规模

色情网站和非色情网站的主要区别就是访问者的停留时间。Engadget和ExtremeTech这类科技网站的用户平均停留时间在3到6分钟之间,这足以让用户阅读完几篇文章了;而色情网站的用户停留时间则在15到20分钟之间。

两者之间的差异也情有可原,因为大多数网站的内容主要是文字和图片,大型色情网站则力推视频内容,众所周知,看完一段视频所花的时间可比阅读完一篇文章花的多。ExtremeTech主页的数据大小约为数百万字节,但一段只有480×200低分辨率的色情视频,每秒的数据量就在10万字节左右,15分钟的视频就可以耗掉约9千万字节的流量。将9千万字节乘以Xvideos网站每月约3.5亿的访问人数,就可以得出Xvideos每月需要处理29PB的字节(1PB=1024TB,1TB=1024GB),即每秒50GB字节的的数据传送。

简而言之,色情网站每天需要处理海量的数据。在纯带宽(单位时间内可传输的数据量)上,美国本土能够与之匹敌的也仅有视频网站YouTube或Hulu了。色情网站的规模大到难以想象,排名第二的YouPorn的纯带宽都要比Hulu大出6倍。

什么样的微博转发量惊人

Palo Alto Research Center 的几位研究者 专门研究 了Twitter上的转发。一条微博被转发的平均次数应该跟两个因素有关:微博本身的内容,以及发帖者的粉丝数。粉丝数容易测量,可是微博内容好坏很难测量,这项研究只能采用最简单的办法。

一个办法是看微博中是否包含网址链接(URL)。包含 URL 的微博至少言之有物,总比发条在哪吃饭的状态有可读性。这个研究总共统计了 7400 万条微博(对 Twitter 来说这叫 tweets),统计发现全部其中 21.1% 包含 URL,而那些纯转发的微博中则有 28.4% 含URL。这个结果似乎不怎么明显,但此文引用的另一项研究的两个数字则分别是 18.96% 和 56.69%。不论如何,介绍一个从别处看到的信息的确能够增加微博的转发几率。

获得更多转发的另一个办法是参与话题,也就我们经常看到的两个“#”,这样别人只要点击这段话就能找到所有写了这段话的微博。统计表明全部 tweet 中的 10.1% 含有话题,而那些转发的tweet含话题的比例则是 20.8%。

这两个数据都平淡无奇,完全符合我们的预期。我们真正想发的是那种一出来就被迅速广为传播,乃至一层一层传出去引发爆炸式增长的微博。但正如我以前曾经在 别用“常识”理解复杂世界 中介绍过的那样,引发这种“twitter瀑布”具有极大的偶然性,就算是粉丝众多的人也未必能经常做到。

这项研究并没有明确指出,但是据我观察更为关键的一个事实是,偶尔发几条被广为转发的微博并不能给你显著增加多少粉丝。@Yaoyao521 今年四月发了一条关于出租车司机不收盲人车费的 微博 ,这条微博讲了一个很好的正能量故事,被转发次数超过一万三千,甚至还被媒体报道。作者目前为止一共发过五千多条微博,可是她的粉丝仍然只有 3608 个。像这样的例子并不罕见,很多情况下并不多——而且我一次都没有因为这个原因关注他们。换句话说,除非你能持续不断地发高质量微博,证明自己是靠能力而不是运气,粉丝才会因转发而增加。

这种人有多少?肯定非常少。下面这张图是前面提到的研究统计出来的转发数跟粉丝数的关系。二者几乎就是个线性关系!一个有 5000 粉丝的人和一个有 1000 粉丝的人,微博平均被转发次数差不多也是五倍关系。这说明平均而言,粉丝多的人发的微博质量并不比粉丝少的人更高,他们仅仅因为粉丝多而获得更多转发!这个统计还表明平均每一千粉丝带来的转发数是每条微博 1.5 次,如果你的成绩比这个好,那么你属于水平比较高的。

图片 4

有人认为多发微博可以涨粉丝,有人认为微博贵精不贵多,而这项研究告诉我们的就是你的转发几率跟你发微数量根本没关系。下图是被转发几率与发微总数的关系:

图片 5

如图所示,不管你已经发过 500 条还是 5000 条,你下一条微博被转发的几率,平均而言,都是差不多一次。而发微频率高的人累积的条数也多,这说明 发微薄频率完全不影响被转发几率 ,因此也就不影响通过被转发而涨粉丝。

图片 6研究人员在德国汉堡进行的一次交通堵塞仿真。左图为攻击前高速公路上的实时路况,右图为使用错误的交通数据进行攻击后仿真出来的路况。

网站的基础设施

与仅仅提供文字和图片相比,视频服务所需要的资源可要多得多了,它需要大量的数据储存、较短的CPU周期、内部I/O和高带宽等。

虽然说色情网站各不相同,但是大多数色情网站都会储存大约50到200TB的色情资料,对一个网站来说,这可不是一个小数目。不过幸好现在2TB的硬盘驱动器价格低廉且种类繁多,因此这对色情网站来说应该不算是太大的问题。

色情网站需要提供数千个动态的、可搜索的视频数据库,当有人点击一个视频时,文件会经过硬盘读取继而上传到网络上,这是一个繁杂的过程,而CPU周期和I/O能够影响数据的读取和上传的快慢。除此之外,在硬件方面,色情网站还需要四核机架服务器、千兆交换机和负载均衡等。在软件方面,大多数色情网站会使用快速、灵敏的数据库,如Redis来储存和提取视频,还有轻量级、高性能的Nginx等来作为网页的HTTP服务器。

在带宽上,拿上面的Xvideos为例,大型的色情网站需要有足够的网络连通性来完成每秒400Gb的数据传送。而且这还只是平均的数据传输速率,在高峰时段,Xvideos的背板带宽可以飙升至每秒1000Gb甚至更多。当然了,有许多方法可以解决流量过多产生的问题,如网站可以成立自己的数据中心,或租用大型数据中心的一些机架服务器,或使用如亚马逊或微软提供的云储存等。

结论

总而言之,逆天靠系统,名人靠事件,普通人没事件只能靠推荐,没人推荐则靠转发,而转发靠内容。以上获得粉丝手段的有效性是直线下降的,后面的远远不如前面。而最没用的,就是你的发微数量。这些性质说明我们之所以会关注某个人物,在大多数情况下是因为对这个人本身的关注,而绝不只是想看他发些什么。

本文只讨论了个人综合微博,以上所有分析未必适用于各种专业微博,比如专门搜集笑话的微博。也许只发某一方面内容的账号更容易获得粉丝,因为别人对你的内容有固定的期待。这种账号对读者来说虽然很重要,对写的人来说却未必有多大乐趣,相当于是微博世界里的NPC(非玩家控制角色)。

总而言之,想涨粉丝?功夫在微博之外。既然如此,索性别计较什么粉丝数了。也许我们写微博的真正乐趣不是为了吸引粉丝,而是图个说话痛快!


 

作者注:

谷歌提供的导航服务基于移动设备上谷歌地图应用产生的实时交通信息。传输位置信息所用的协议则受一个TLS(Transport Layer Security,安全传输层协议)通道的保护来确保数据的完整性,同时也可以防止攻击者在不被谷歌发现的情况下监听外部电话或修改信息。但是,如果TLS通道的源头被攻击者控制了的话,它也就无法发挥作用。

真实的范例

世界第二大色情网站YouPorn给我们提供了一些一手的数据,看完你就会发现,事实上,谷歌的Doubleclick广告服务商低估了色情网站的吸引力。

YouPorn有超过100TB的色情资料,每天的页面访问量超过1亿,这就意味着它每天的数据传输量有950TB之多,大多数的数据传送用在了加载视频上。按照上面的数据计算,YouPorn每月的数据处理量有28PB,因此,排名第一的Xvideos的数据传送肯定不止29PB,它每月的数据传送量估计在35到40PB之间。在高峰时间段,YouPorn每秒需要处理100GB(每秒800Gb)的数据量,这个数据量等于YouPorn每秒传送了10多张双层的DVD。

在软件方面,YouPorn完全使用Redis进行数据存储,并使用MySQL小型数据库管理系统对Redis进行添加或管理。网页的HTTP服务器是Nginx,负载均衡则使用的是HAProxy和Varnish。Redis服务器每秒需要处理30万个页面请求,每小时会记录下8到15GB的数据(包括用户登录、观看记录等),YouPorn认为Redis处理每天2亿的访问量不成问题。

互联网只能处理50Tb每秒的数据,换而言之,单单一个YouPorn的流量就占了整个互联网的2%。类似YouPorn这样的色情网站有数十个之多,因此,认为色情网站的数据传送量占据整个互联网的30%就不算夸张了。

 

图片和信息来源: extremetech

本文采用的两项研究都是针对Twitter的,我并不知道这些研究是否符合中国国情。一个有意思的现象是新浪微博的数量级似乎比Twitter大得多。在Twitter有5000粉丝已经很不错了,而在新浪微博一万都未必是个体面的数字。《别用“常识”理解复杂世界》中介绍的那个研究,两个月内7400万条tweets中有几十条被转发超过千次,而转发次数达到万次以上的只有一两条

在新浪微博,转发万次根本不显眼。所以再次呼吁有识之士拿国产微博多做研究。另外,我的微博账号是 @GK同人于野,欢迎关注!

编辑的话:本文引述的研究源自国外学者对推特的统计,它们描述了一个普通社交网络环境下的粉丝增长规则。如果你身处“僵尸围城”的环境之下,这样的规则很可能并不有效。最近围绕着“争夺新浪微博女王桂冠”展开的粉丝大战,就被认为有大波僵尸军团参战——想打赢僵尸粉?光靠统计分析可不行。

本文由betway必威官网注册发布于科学,转载请注明出处:黑客是怎样造成堵车的,功夫在微博之外

关键词:

上一篇:两个创始人间的战争,GNU创始人炮轰Facebook

下一篇:没有了