得益于bt(bittorrent)、电驴等p2p下载软件,使得国内用户可以基本无障碍的接入全球文件分享网络,或者说全球盗版网络。
不过因为下载速度的原因,很多人下载一部热门电影需要挂机一整天,要是冷门纪录片需要时间就更长了。
p2p点对点下载软件的原理是,文件资源上传者将文件上传到国际互联网时,软件会使用算法将该文“化整为零”分割成大量小数据块,同时在服务器保留“化零为整”,重新还原会正常文件的方法。其他用户的客户端通过bt种子文件或者电驴地址得到这份数据包列表,就可以通过软件从其他拥有这些数据包的用户那里下载数据分块,同时自己已经下载的数据块也在自动上传给其他用户,数据块集齐之后,文件被还原出来,下载完成。
所以p2p下载方式里面除了资源发布者以外,人人都是下载者也都是上传者,极大的增加了上传带宽,同时参与下载的人越多,下载速度越快,同一数据块在网络上的镜像更多资源也不容易失效。
在这年代无论中外,大家更多还是抱着一种互联网的分享精神来做这件事情,经常有人应求补档,长期开机做种为其他用户上传资源。
不过利己主义者从来不缺的,有人在下载时关闭上传功能,或者限制上传速度;有人下载完成之后立即退出p2p下载软件不再上传;也有盗版商开着电脑下载网友分享的美国大片以及免费字幕,打包压缩以后制作成盗版dvd,出售牟利。
马竞接触到的“影视资源硬盘版”销售某种意义上说跟盗版商是一个性质的,唯一不同的就是规模了。专业盗版商很多都是大型光盘厂,产量都是以万张来计算的。
而这些出售影视资源硬盘版的卖家却都是单打独斗,一根网线一台pc几块硬盘一个桃宝帐号就开张了。很多人可能一开始只是想要通过加价卖硬盘的方式回收一些挂机下载产生的电费,后来就慢慢扩大了规模。
不过小水管始终是小水管,这样的生意因为网络小水管而生,也因为网络小水管严重限制了它的规模。一张dvd光盘只能放一部mpeg-2编码(dvd标准编码,落后时代,压缩率较低体积较大)的电影,但是一块160gb的硬盘却可以放超过一百部rmvb(rm公司开发的专利视频压缩格式,体积更小,此时网络上最流行的视频压缩格式)格式的影片,要是使用mp4(mpeg-4,新一代标准压缩格式,国外使用更多)格式,甚至可以塞进去两百部。
一开始马竞只是在桃宝上偶然看到有人用卖硬盘的出售这些影视资源,考虑到正版买不到,网上下载太慢,他就试着买了一块,虽然只是普通的电影合集,但是通过e7u的整理分析之后,他却从里面得到1579种人脸、321种植物、304种房屋建筑物、208种汽车、87种动物、13张飞行器的部分数据。这些建筑、交通工具、植物、动物以及人脸数据也被加入了幻想电视剧的开发素材库里面。
大喜之下,马竞便开始了满世界淘硬盘的过程。的确是满世界淘,一开始只是买国内卖家的,结果一段时间之后发现文件重复率越来越高,马竞意识到国内的资源库存应该已经快被他挖空了。
要么是这些卖家互相“抄袭”,要么是他们都在同样地方下载资源,导致他们的资源库存越来越趋近。而此时已经收集了上千部国产电视剧的马竞对于国内的影视城实在是看吐了——他在发现13部电视剧里面看到了同样的客栈,在23部电视剧里面看到了同样一串辣子,在18部电视剧里面看到了同样一个日本人,在9部电视剧里面看到同样一个皇宫,某棵大树的出镜次数更是多的数不清……
这时候就只能把视线转向国外了,国外卖家虽然不用支付包,但是他们使用的paypal作为支付包的原型,其实并没有多少区别。想办法开通了外币帐户,激活paypal以后,马竞就开始陆续收到海外寄来的硬盘了。
因为之前在国内购买时遭遇了不少内容重复的问题,马竞专门设计了一款验货软件。他会在付款前通过聊天软件留言让卖家把准备出售的硬盘连接到电脑上,用指定“文件夹预览器”这个工具软件扫描生成一份预览文件发给他。而这个上传在全球上百家下载网站的文件扫描小工具虽然名字与上传者都有不同,实际上作者都是马竞自己。
这些软件能够快速扫描大量文件,生成包含文件名、大小、创建日期、修改日期、md5校验码的文本信息。同时软件也会调用系统解码插件,为部分图片和视频、音频文件建立缩略图、截图、压缩音频片段,配合这些预览片段以及高度唯一性的md5编码,能够极大避免文件重复问题。
这些文本信息和缩略图、截图、音频片段会被自动封装成一个压缩包,进行二次压缩以减少通过国际互联网传输时的时间消耗。收到这个压缩包的人使用发送者提供的密钥解密压缩包之后可以查看里面的文件列表和缩略图。
这样一来,因为压缩包被二次压缩的关系,缩略图文件的体积大大减小,极大的避免了寻找资源时“多图杀猫”的问题。
这个“猫”并不是cat猫咪,而是modem(调制解调器),功能是将网线的数字信号调制转化成电话线的模拟信号,从而使得用户可以借助电话线上网(拨号上网或者adsl“宽”带)。
“多图杀猫”指的就是网页图片太大太多导致网页载入时间过长,长时间打不开感觉就像‘猫’死了一样,当然也有可能真的是“猫”死了,甚至电脑死了……
这个缩略图功能本来是马竞专门给自己准备的,所有马竞已经下载到的内容都在他脑子里面装着(其实是在全身皮肤下的e7u组织里面),只需要看一眼截图、缩略图就能知道自己这边有没有相关内容。至于其他人还是直接使用同样的“文件夹预览器”小工具比对自己库存来的更加快捷一些,不过这样就无法排除那些加水印导致md5校验码改变的重复文件。
不过因为马竞的截取片段的算法比较智能,总能找到有内容的信息,不像其他截取预览图的软件经常截取出莫名其秒的画面,因此渐渐得到了不少做种上传用户的欢迎,一些找不到图床(网络公开相册)放预览图的用户直接同时上传bt种子和对应的“预览包”,或者干脆把“预览包”也一起打包上传,慢慢地越来越多用户使用这个小工具。
这并不是马竞第一次为推进全球文件分享事业的发展做贡献了,在之前购买的硬盘里面,他就发现了蜜蜂搬运的身影。
蜜蜂搬运是蜜蜂系列软件里面的专业下载工具,是全球第一个支持“bm”下载协议的下载软件。
“bm”是“bittorrent(bt)”和“emule(电骡)”的合体,名字两个字母分别来自这两款最流行的p2p文件分享协议。蜜蜂搬运同时支持bt和emule两种下载方式,并且将二者融合起来,并因此同时支持bt网络、ed2k网络和kad网络三种文件传输方式。
ed2k网络是两年前最火的下载软件电驴(edonkey2000)的专用p2p文件分享网络,每个运行中的客户端会向服务器发送请求,服务器返回一份其他用户列表,用户计算机借此与其他用户发生联系,从而开始文件下载。
因为ed2k上面有大量盗版音乐、影视内容,损害了美国唱片工业协会(riaa)的的利益,电驴在去年输掉了官司,被判罚向riaa赔款3000万美元并且永久停止开发。
不过因为ed2k是基于p2p的网络,打掉了电驴公司使其停止开发电驴软件(edonkey2000)并不能停止ed2k网络的运行。于是riaa开始通过诉讼手段向各国施压,要求打掉各自国内的ed2k服务器,今年2月时候,拥有超过百万用户的全球最热门的服务器razorback2被比利时联邦警察查封。
此后ed2k网络上就开始出现许多“不好用”的服务器,它们只提供极少的搜索和来源查找功能,据说这些服务器是riaa等版权方为了毁灭ed2k网络以及搜集违反版权法盗版用户的证据信息而建立的。
因此,“电驴”的继承者“电骡(emule)”在原本ed2k网络支持的同时,加入了对kad网络的支持,以对抗ed2k网络上越来越糟糕的服务器环境。kad网络网络使用kade协议,使用了分布式杂凑表计算系统,文件搜索功能依靠每一个联网用户来完成,摆脱了对中央服务器的依赖。
电骡是一款开源软件,新版本既有针对普通用户的windows安装程序,也有针对开发者的源文件,任何人都可以自行修改改进,这使得emule更新非常快,几周就会有一次更新。在电驴被法庭禁止开发以后,电骡接过了维护并且升级ed2k网络的大旗,而在国内,则最为流行cd下载网站的cd中文版emule,加入了中文界面以及一些适合国内用户的功能,同时移出了一些emule原版功能,因此招致不少批评。
因为bt和emule都是开源软件的关系,全世界很多下载软件都加入了对这二者的支持,所以“同时兼容bt、ed2k、kad”并不是bm下载软件的独创,但是作为开挂的“天才程序员”,马竞的作品怎么可能只是止步于此?
就算是国内的雷讯5都要“针对国内用户习惯”,上传规则取消bt的“黄金法则:从一个用户那里得到的越多,回馈也越多,得到越少,回馈越少”,变身“吸血驴”、“吸血bt”,bm自然也在协议上面动了一些手脚。
bm软件最大的改动都在它的名字上面,一方面bm协议就像是它的名字说的那样,“真正”同时支持bt和emule。这个“真正”指的是bm可以脚踩两条船,同时从bt网络和emule网络获得文件数据流。
另一方面,“bm”还是“保密”的首字母缩写,“bm”加强了用户ip地址和文件信息的加密,使得追踪变得困难起来。