HTTP:超文本传输协议
hypertext transfer protocol
是我们每天使用最多的协议之一
每当我们访问网站,浏览网页就是基于HTTP协议
所以掌握HTTP是十分重要的
概述
-
是 Web的应用层协议
-
基于 client/server模式
- client: 浏览器browser请求, 接收、解释、显示 Web对象
- server: Web服务器响应请求,发送 Web对象
- HTTP 1.0: RFC 1945
- HTTP 1.1: RFC 2616
-
下层的服务是使用 TCP协议
- 客户初始化一个与HTTP服务器80端口的TCP连接 (创建套接字)
- HTTP服务器接受来自客户的TCP连接请求, 建立连接
- Browser (HTTP client)和Web服务器 (HTTP server) 交换HTTP消息(应用层协 议消息)包括HTTP请求和响应消息
- 最后结束(或叫关闭)TCP连接
-
是无状态协议
- 不维护客户先前的状态信息(很复杂)
常用术语
Web 和 HTTP
-
网页 (Web页,或称文档)由许多对象组成。
-
对象就是文件,可以是HTML文件, JPEG图像, Java applet, 音频文件…
-
多数网页由单个基本HTML文件和若干个所引用的对象构成
-
每个对象被一个URL(Uniform Resource Locator统一资源定位符)寻址,确定对象的位置
HTTP连接方式
持久连接
- 每个TCP连接上只传送一个 对象,下载多个对象需要建 立多个TCP连接
- HTTP/1.0使用非持久HTTP 连接
非持久连接
- 一个TCP连接上可以传送多个对象
- HTTP/1.1默认使用持久 HTTP连接
例子:假设用户输入URL http://www.someSchool.edu/someDepartment/home.index
-
HTTP客户初始化1个与服 务器主机 www.someSchool.edu中 HTTP服务器的TCP连接
-
www.someSchool.edu服务器 主机中的HTTP服务器在80端口监 听来自HTTP客户的TCP连接请求. 收到连接请求, 接受, 建立连接, 通 知客户
-
HTTP客户发送1个HTTP 请求消息 (requestmessage )包含URL到 TCP连接套接字. 消息指出 客户要Web对象- someDepartment/hom e.index
-
HTTP服务器接收请求消息, 产生1个响应消息response message 包含被请求对象, 并发送这个消息到自身TCP 连接套接字
-
HTTP服务器结束TCP 连接.
-
HTTP 客户接收包含html 文件的响应消息, 显示html. 解析html文件, 找出10个引 用 jpeg对象
-
对10个引用jpeg对象的 每1个重复步骤1-5
响应时间模型
定义往返时间RTT(Round-Trip Time):
1个小分组从客户主机到服务器再到客户主机所花费的时间.
响应时间:
- 1个RTT用于建立TCP连接
- 1个RTT用于HTTP请求/响应消息的交互
- Html文件传输时间
total = 2RTT+transmit time
持久HTTP连接
服务器发送响应消息后保 持连接
同1客户/服务器的后续 HTTP 消息继续在该连接 上传送
非持久HTTP连接,我们看到了一些问题:
- 每个对象需要2个RTT
- OS必须为每个TCP连接分配主机资源
- 大量客户的并发TCP连接形成服务器的严重负担
所以我们 来看看持久的HTTP连接