HTTP:超文本传输协议

hypertext transfer protocol

是我们每天使用最多的协议之一

每当我们访问网站,浏览网页就是基于HTTP协议

所以掌握HTTP是十分重要的

概述

  • 是 Web的应用层协议

  • 基于 client/server模式

    • client: 浏览器browser请求, 接收、解释、显示 Web对象
    • server: Web服务器响应请求,发送 Web对象
      • HTTP 1.0: RFC 1945
      • HTTP 1.1: RFC 2616
  • 下层的服务是使用 TCP协议

    • 客户初始化一个与HTTP服务器80端口的TCP连接 (创建套接字)
    • HTTP服务器接受来自客户的TCP连接请求, 建立连接
    • Browser (HTTP client)和Web服务器 (HTTP server) 交换HTTP消息(应用层协 议消息)包括HTTP请求和响应消息
    • 最后结束(或叫关闭)TCP连接
  • 是无状态协议

    • 不维护客户先前的状态信息(很复杂)

常用术语

WebHTTP

  • 网页 (Web页,或称文档)由许多对象组成。

  • 对象就是文件,可以是HTML文件, JPEG图像, Java applet, 音频文件…

  • 多数网页由单个基本HTML文件和若干个所引用的对象构成

  • 每个对象被一个URL(Uniform Resource Locator统一资源定位符)寻址,确定对象的位置

HTTP连接方式

持久连接

  • 每个TCP连接上只传送一个 对象,下载多个对象需要建 立多个TCP连接
  • HTTP/1.0使用非持久HTTP 连接

非持久连接

  • 一个TCP连接上可以传送多个对象
  • HTTP/1.1默认使用持久 HTTP连接

例子:假设用户输入URL http://www.someSchool.edu/someDepartment/home.index

  1. HTTP客户初始化1个与服 务器主机 www.someSchool.edu中 HTTP服务器的TCP连接

  2. www.someSchool.edu服务器 主机中的HTTP服务器在80端口监 听来自HTTP客户的TCP连接请求. 收到连接请求, 接受, 建立连接, 通 知客户

  3. HTTP客户发送1个HTTP 请求消息 (requestmessage )包含URL到 TCP连接套接字. 消息指出 客户要Web对象- someDepartment/hom e.index

  4. HTTP服务器接收请求消息, 产生1个响应消息response message 包含被请求对象, 并发送这个消息到自身TCP 连接套接字

  5. HTTP服务器结束TCP 连接.

  6. HTTP 客户接收包含html 文件的响应消息, 显示html. 解析html文件, 找出10个引 用 jpeg对象

  7. 对10个引用jpeg对象的 每1个重复步骤1-5

响应时间模型

定义往返时间RTT(Round-Trip Time):

1个小分组从客户主机到服务器再到客户主机所花费的时间.

响应时间:

  • 1个RTT用于建立TCP连接
  • 1个RTT用于HTTP请求/响应消息的交互
  • Html文件传输时间

total = 2RTT+transmit time

持久HTTP连接

服务器发送响应消息后保 持连接

同1客户/服务器的后续 HTTP 消息继续在该连接 上传送

非持久HTTP连接,我们看到了一些问题:

  • 每个对象需要2个RTT
  • OS必须为每个TCP连接分配主机资源
  • 大量客户的并发TCP连接形成服务器的严重负担

所以我们 来看看持久的HTTP连接