断点传输与HTTP
P2P、BT下载原理简述:
在以前有一段时间,P2P、BT下载很流行,因为下载速度要比普通下载的速度要快,而且还可以通过种子文件的下载方式下载。
P2P、BT下载快的原因实际上是利用了MD5的特性,为文件设置了独立的编码,达到了资源共享下载的效果,,所以下载速度要比普通下载速度要快,
举个例子:例如,有一个名为《泰坦尼克号》的电影资源,小明需要下载这个电影,这个电影资源小刚和小红的客户端上都下载有,小张也在下载不过只下载到了一半。
这时,小明下载这个电影的话,服务器就会去寻找每个服务器的资源,发现小刚、小红都有这个电影资源,小张则只下载到了一半。这时候他们的这个电影资源就会共享给小明下载,小明就获得多个资源共享,所以下载速度就会变快。
示意图:
断点传输:
断点传输就是在下载的时候,在某个点开了下载,然后再继续下载的时候可以从那个断开的点继续下载。现在很多具备下载功能的软件都具备断点传输的下载方式,断点传输最主要的一点就是,先查找客户端的计算机上有没有这个文件,有这个文件的话再读取一下这个文件的大小,读取到多少字节,就告诉服务器跳过多少字节继续下载。
服务端代码示例:
客户端代码示例:
运行结果:
HTTP:
HTTP是超文本传输协议,是互联网上应用最为广泛的一种协议,所有的WWW文件都必须遵守这个标准。HTTP是基于TCP之上开发出来的,位于OSI模型中的应用层。
HTTP有一个请求头和响应头,当客户端访问服务器时,会先发送一个请求头,然后服务器会回执一个响应头。
HTTPS则是具有SSL加密的HTTP传输协议。
示意图:
HTTP请求协议:
GET /form.html HTTP/1.1 (CRLF)
Accept:image/gif,image/x-xbitmap,image/jpeg,application/x-shockwave-flash,application/vnd.ms-excel,application/vnd.ms-powerpoint,application/msword,*/* (CRLF)
Accept-Language:zh-cn (CRLF)
Accept-Encoding:gzip,deflate (CRLF)
If-Modified-Since:Wed,05 Jan 2007 11:21:25 GMT (CRLF)
If-None-Match:W/"80b1a4c018f3c41:8317" (CRLF)
User-Agent:Mozilla/4.0(compatible;MSIE6.0;Windows NT 5.0) (CRLF)
Host:www.guet.edu.cn (CRLF)
Connection:Keep-Alive (CRLF)
(CRLF)
下载请求头:Range: bytes=0 - 499
OSI网络分层参考模型:
URL操作类:
URL操作类可以模仿HTTP的请求头,可以使用这个类模仿浏览器去访问网站,读取网站的脚本数据。
运行结果:
本文转自 ZeroOne01 51CTO博客,原文链接:http://blog.51cto.com/zero01/1976687,如需转载请自行联系原作者