色情网站有多大,当你最爱的软件被收购

生活在互联网世界的人,都曾或多或少地浏览过在许多国家仍受管制的色情网站。我们很难洞察这类网站的发展状况,因为相关的确切数据实在是少之又少。可以肯定的是,色情网站的访问量肯定少不了。事实证明上述猜测是正确的,因为根据谷歌旗下广告服务商Doubleclick的数据显示,独立访问量前500名的网站中,竟有数十个是成人网站!

图片 1

图片 2

世界上最大的色情网站Xvideos每月有44亿的访问量,这个数字是CNN官网或24小时专门播放体育节目ESPN电视网的访问量的3倍,是社交新闻站点Reddit的2倍。YouPorn、Tube8和Pornhub这些大型的色情网站,其访问量也可以让除了Google和Facebook等超大型网站之外的小网站们相形见绌。

最近两天,整个IT界和媒体们都在无休止谈论一件事:Facebook收购Instagram。事情其实很简单,一个预估市值已达1000亿美元的互联网巨无霸用一点零花钱买了一个致力于让自拍照变得更吸引人的迷你公司,然后掀起了不小的波澜。其中自然有许多人对此抱有负面看法,推特上关于此收购的信息中,超过35%对该交易表示“愤怒”,有的说“这次收购肯定会毁了Instagram”,有的说“十亿美元太多了”,更多批评声来自Instagram的用户,他们非常不愿意看到自己喜欢的小公司被一个自己不信任的大公司收购。类比一下,你们也不愿意看到果壳网被腾讯收购吧?

点击查看大图

从访问量中,我们只能得出色情网站要比非色情网站更受欢迎这个结论。40亿访问量听起来确实是个天文数字,但是当你将用户在色情网站上做的事考虑在内,你就会发现,色情网站的大小和规模也不可小觑。

这到底是为什么呢?

07年美国次贷经济危机余波已散,许多国家的经济开始慢慢复苏,但佛蒙特大学的一项最新研究显示,人们的幸福值正在不断下降中。

网站规模

色情网站和非色情网站的主要区别就是访问者的停留时间。Engadget和ExtremeTech这类科技网站的用户平均停留时间在3到6分钟之间,这足以让用户阅读完几篇文章了;而色情网站的用户停留时间则在15到20分钟之间。

两者之间的差异也情有可原,因为大多数网站的内容主要是文字和图片,大型色情网站则力推视频内容,众所周知,看完一段视频所花的时间可比阅读完一篇文章花的多。ExtremeTech主页的数据大小约为数百万字节,但一段只有480×200低分辨率的色情视频,每秒的数据量就在10万字节左右,15分钟的视频就可以耗掉约9千万字节的流量。将9千万字节乘以Xvideos网站每月约3.5亿的访问人数,就可以得出Xvideos每月需要处理29PB的字节(1PB=1024TB,1TB=1024GB),即每秒50GB字节的的数据传送。

简而言之,色情网站每天需要处理海量的数据。在纯带宽(单位时间内可传输的数据量)上,美国本土能够与之匹敌的也仅有视频网站YouTube或Hulu了。色情网站的规模大到难以想象,排名第二的YouPorn的纯带宽都要比Hulu大出6倍。

首先,想理解这次交易,就要理解Facebook这个公司。但不幸的是,此公司天生就是一个反逻辑产物。在用户体验方面,Facebook就像是一辆警车冲进了宜家一样,把一大堆与你生活各方面相关的产品“撞”到了用户面前;在技术方面,Facebook也是一个奇怪的范例,比如他们的大部分网站代码都是用PHP这种糟糕的语言编写的——虽然有数百万个网站是基于PHP语言编写的,但是这种廉价、简单的语言根本算不上真正的编程语言。这就是Facebook,一个喜欢不按常理出牌的公司,他们做事的方法往往遭受人们的质疑,但是居然每次都能奏效。

研究的第一作者、应用数学家彼得·多兹(Peter
Dodds)和同事们在过去三年里从全球6300万推特用户发布的新鲜事中,选取了630亿个单词,用以衡量人们在过去的三年里幸福值是下降还是上升。随后,多兹雇佣了一群志愿者,让他们使用亚马逊的土耳其机器人(一个Web服务应用程序接口),根据自己的感觉来为1万个最常见的英文单词打下最高9分的幸福指数分。在将这些分数平均之后,“笑声”得分8.5,“食物”得分7.44,“贪婪”得分3.06,“恐怖主义”得分1.30。

网站的基础设施

与仅仅提供文字和图片相比,视频服务所需要的资源可要多得多了,它需要大量的数据储存、较短的CPU周期、内部I/O和高带宽等。

虽然说色情网站各不相同,但是大多数色情网站都会储存大约50到200TB的色情资料,对一个网站来说,这可不是一个小数目。不过幸好现在2TB的硬盘驱动器价格低廉且种类繁多,因此这对色情网站来说应该不算是太大的问题。

色情网站需要提供数千个动态的、可搜索的视频数据库,当有人点击一个视频时,文件会经过硬盘读取继而上传到网络上,这是一个繁杂的过程,而CPU周期和I/O能够影响数据的读取和上传的快慢。除此之外,在硬件方面,色情网站还需要四核机架服务器、千兆交换机和负载均衡等。在软件方面,大多数色情网站会使用快速、灵敏的数据库,如Redis来储存和提取视频,还有轻量级、高性能的Nginx等来作为网页的HTTP服务器。

在带宽上,拿上面的Xvideos为例,大型的色情网站需要有足够的网络连通性来完成每秒400Gb的数据传送。而且这还只是平均的数据传输速率,在高峰时段,Xvideos的背板带宽可以飙升至每秒1000Gb甚至更多。当然了,有许多方法可以解决流量过多产生的问题,如网站可以成立自己的数据中心,或租用大型数据中心的一些机架服务器,或使用如亚马逊或微软提供的云储存等。

再让我们来看看Instagram。如果说Facebook是一颗枝繁叶茂的参天大树,那么Instagram就是树旁的一颗小草,这个软件只有很简单的功能:你可以用它在拍摄的照片上加上一些很傻瓜的滤镜,然后与朋友分享拍摄的照片、并且浏览那些其他人上传的趣图。Instagram甚至没有一个网站,一切行动都通过移动设备进行,就这样吸引了三千万用户用它消磨“大号时间”。这就是Instagram,它并没有满足用户的某种需求,只是提供给了用户足够的新鲜感,它不是一个网站,也不是一个应用,它其实是个“产品”。

将这些分数应用到抽取的630亿个单词后,研究人员就得出了一张不同时间段全球人民的幸福指数趋势图。从图中我们可以看出,每到节日假期人们的幸福值就达到高峰,在2009年1月至4月期间,人们的幸福值逐渐上升,但是之后人们的幸福值整体处于下滑的趋势,2011年上半年幸福值下降幅度更大。由于这些数据信息是从推特中获取的,所以现在还不知“人们越来越不幸福”这个结论是否代表整个世界都这样。

发表评论

电子邮件地址不会被公开。 必填项已用*标注