解析BitTorrent协议的原理
下载,是我们网络利用中非常广泛的一项用能。也是网络分享资源的一种方法。那么在这里我们来对BitTorrent协议的下载技术进行一下介绍。信任说起这个BitTorrent大家断定不会有所陌生的。
Bittorrent
Bittorrent已经成为最为风行的P2P软件,在2004年6月的Cachelogic的一份测试是报告中提到Bittorrent的数据流量已经占到全部P2P数据流量的52%?与其他传统P2P软件如Gnutella,Fasttrack不同,Bittorrent只是一个纯粹的文件下载协议,并供给搜索功效,所以往往资源的获取要跟其他一些利用联合起来,比如说发布Bittorrent种子信息的网站如5Q?或者是网络搜索引擎如百度?google等?
Bittorrent工作原理
Bittorrent的工作原理其实很简略,他就是将一份数据分隔成256K大小的数据分组,并在Bittorrent 网络中一群用户相互协作完成这些数据的分发,用户参与数据分发的信息已文件的情势存储,一般可以通过web网站获取这些信息?但是实际数据传输依附的不是Http协议,而是由专门的P2P协议来完成,这些对于用户都是透明的?
普通的HTTP/FTP下载利用TCP/IP协议,BitTorrent协议是架构于TCP/IP协议之上的一个P2P文件传输协议,处于TCP/IP结构的利用层? BitTorrent协议本身也包含了很多具体的内容协议和扩大协议,并在不断扩充中?
根据BitTorrent协议,文件发布者会根据要发布的文件生成供给一个.torrent文件,即种子文件,也简称为“种子"? .torrent文件本质上是文本文件,包含Tracker信息和文件信息两部分?Tracker信息重要是BT下载中需要用到的Tracker服务器的地址和针对Tracker服务器的设置,文件信息是根据对目标文件的计算生成的计算成果根据BitTorrent协议内的B编码规矩进行编码?它的重要原理是需要把供给下载的文件虚拟分成大小相等的块,块大小必须为2k的整数次方(由于是虚拟分块,硬盘上并不产生各个块文件),并把每个块的索引信息和Hash验证码写入.torrent文件中;所以,.torrent文件就是被下载文件的“索引"?
下载者要下载文件内容,需要先得到相应的.torrent文件,然后利用BT客户端软件进行下载?
下载时,BT客户端首先解析.torrent文件得到Tracker地址,然后连接Tracker服务器?Tracker服务器回应下载者的恳求,供给下载者其他下载者(包含发布者)的IP?下载者再连接其他下载者,根据.torrent文件,两者分辨对方告诉自己已经有的块,然后交换对方没有的数据?此时不需要其他服务器参与,疏散了单个线路上的数据流量,因此减轻了服务器累赘?
下载者每得到一个块,需要算出下载块的Hash验证码与.torrent文件中的对照,如果一样则阐明块正确,不一样则需要重新下载这个块?这种规定是为懂得决下载内容正确性的问题?
一般的HTTP/FTP下载,发布文件仅在某个或某几个服务器,下载的人太多,服务器的带宽很易不输赢荷,变得很慢?而BitTorrent协议下载的特点是,下载的人越多,供给的带宽也越多,种子也会越来越多,下载速度就越快?而有些人下载完成后关掉下载任务,供给较少量数据给其他用户,为尽量避免这种举动,在非官方BitTorrent协议中存在超级种子的算法?这种算法容许文件发布者分几步发布文件,发布者不需要一次供给文件所有内容,而是慢慢开放的下载内容的比例,延伸下载时间?此时,速度快的人由于未下载完必须供给给他人数据,速度慢的人有更多机会得到数据?