HTTP协议的结构
Internet是由各个协议连接起来的,而我们现在利用最广的莫过于HTTP协议了,也就是超文本传输协议,与FTP(文件传输协议)不同,由于重要用于超文本传输,因此HTTP协议显得更简略一点。今天我们来介绍一下HTTP协议的基础格式。
在这里,我们所谈及的HTTP协议以HTTP/1.1为标准,并且利用Net Vampire Pro 4.0来取得与HTTP服务器的通信Log,您也可以利用其它的HTTP下载工具来取得通信Log。
在HTTP协议中,服务端是指供给HTTP服务的部分,客户端是指你利用的浏览器或者下载工具等等。在通信时,由客户端发出恳求连接,服务端建立连接;然后,客户端发出HTTP恳求(Request),服务端返回响应信息(Respond),由此完成一个HTTP操作。我们来通过一个例子来懂得这个过程:(以下是Net Vampire进行的一次连接,以下红色字体为作者添加)
P 01-5-26 16:10:43 Connecting to go2.163.com ... //连接服务器
P 01-5-26 16:10:44 Connected to go2.163.com [61.129.65.148] //解析IP地址,以下为HTTP操作
S 01-5-26 16:10:44 GET /~minift/epretty/pretty.zip HTTP/1.1 //恳求行(Request Line),表现利用GET方法取得文件,利用HTTP/1.1协议
//以下为恳求头部(Request Head)
S 01-5-26 16:10:44 Connection: close //表现非持续性连接
S 01-5-26 16:10:44 Host: go2.163.com //主机名称
S 01-5-26 16:10:44 Accept: */* //吸收的数据类型
S 01-5-26 16:10:44 Pragma: no-cache //参数(与以前的服务器兼容)
S 01-5-26 16:10:44 Cache-Control: no-cache //不利用缓存
S 01-5-26 16:10:44 Referer: http://go2.163.com/~minift/epretty //从该网址转来
S 01-5-26 16:10:44 User-Agent: Mozilla/4.04 [en] (Win95; I ;Nav) //客户端标识
S 01-5-26 16:10:44 Cookie: AdId=ACDDAAAAAAA
S 01-5-26 16:10:44 //以下为Respond
R 01-5-26 16:10:47 HTTP/1.0 200 OK //响应行(Respond Line),服务器利用HTTP/1.0协议,状态值(Status Code)为200,状态为OK,表现文件可以读取
R 01-5-26 16:10:47 Date: Sat, 26 May 2001 08:15:54 GMT //现在的时间,用格林威治时间表现
R 01-5-26 16:10:47 Server: Apache/1.3.14 (Unix) mod_layout/2.9.9 //服务器类型
R 01-5-26 16:10:47 Last-Modified: Fri, 04 May 2001 02:42:56 GMT //文件最后更新时间
R 01-5-26 16:10:47 ETag: "e614cf-37965-3af21730"
R 01-5-26 16:10:47 Accept-Ranges: bytes //吸收的领域单位
R 01-5-26 16:10:47 Content-Length: 227685 //文件长度
R 01-5-26 16:10:47 Content-Type: application/zip //MIME类型
R 01-5-26 16:10:47 X-Cache: MISS from shca8
R 01-5-26 16:10:47 X-Cache-Lookup: MISS from shca8:80
R 01-5-26 16:10:47 Connection: close //表现文件传输完毕就关闭连接。
R 01-5-26 16:10:47 //以下为文件传输
P 01-5-26 16:10:47 Data transfer started
下面来讲解利用的格式(LRCF=@13@10,即回车,SP=SPACE,即空格)
Request:
协议方法 SP 文件URI SP 协议版本 LRCF (恳求行)
(以下为头部)
头部类型 : 头部值 LRCF
头部类型 : 头部值 LRCF
头部类型 : 头部值 LRCF
......
LRCF 表现头部结束
(如果有体部,以下为体部)
Respond:
协议版本 SP 状态值 SP 状态描写 LRCF (响应行)
(以下为头部)
头部类型 : 头部值 LRCF
头部类型 : 头部值 LRCF
头部类型 : 头部值 LRCF
......
LRCF 表现头部结束
(如果有体部,以下为体部)
由上可见,恳求与相应的格式只有部分不同,是很容易懂得的,现在你应当基础懂得HTTP协议了吧,也能看懂那些通信Log了吧,下一次我们讲专门讲解在响应行中的状态值含义及一些特别情况。