The Hypertext Transfer Protocol (HTTP) is an application protocol for distributed, collaborative, hypermedia information systems. HTTP is the foundation of data communication for the World Wide Web.
Hypertext is structured text that uses logical links (hyperlinks) between nodes containing text. HTTP is the protocol to exchange or transfer hypertext.
Development of HTTP was initiated by Tim Berners-Lee at CERN in 1989. Standards development of HTTP was coordinated by the Internet Engineering Task Force (IETF) and the World Wide Web Consortium (W3C), culminating in the publication of a series of Requests for Comments (RFCs). The first definition of HTTP/1.1, the version of HTTP in common use, occurred in RFC 2068 in 1997, although this was obsoleted by RFC 2616 in 1999.
A later version, the successor HTTP/2, was standardized in 2015, and is now supported by major web servers.
HTTP发展史
HTTP/0.9
最早版本是1991年发布的0.9版。该版本极其简单。只支持简单的HTML格式的字符串传送。
HTTP/1.0
1996年5月,HTTP/1.0发布,新增MIME机制。支持了任何格式的内容传送。包括文字、图片、视频、二进制文件等。 为互联网的猛速发展奠定了基础。
HTTP/1.1
1997年1月,HTTP/1.1发布。
- 持久连接
HTTP1.1的最大变化,就是引入了持久连接(persistent connection),即TCP连接默认不关闭,可以被多个请求复用,不用声明 Connection:keep-alive。 - 管道机制
HTTP1.1版本引入管道机制(pipelining),即在同一个TCP连接里面,客户端可以同时发送多个请求,但是服务器还是按照顺序依次响应请求。 进一步改进了HTTP协议的效率。 - Centent-Length 字段
一个TCP连接现在可以传送多个回应,那么就要有一种机制来区分数据包是属于哪一个回应的。 这就是Content-Length字段的作用,声明本次回应的数据长度。
1 | Content-Length: 3698 |
表示告诉浏览器,本次回应的长度是3698个字节,后面的字节就属于下一个请求回应的。
- 分块传输编码
使用Content-Length字段的前提条件是,服务器发送回应之前,必须知道回应的数据长度。
对于一些很耗时的动态操作来说,这意味着,服务器要等到所有操作完成,才能发送数据,显然这样的效率不高。更好的处理方法是,产生一块数据,就发送一块,采用"流模式"(stream)取代"缓存模式"(buffer)。
因此,1.1版规定可以不使用Content-Length字段,而使用"分块传输编码"(chunked transfer encoding)。只要请求或回应的头信息有Transfer-Encoding字段,就表明回应将由数量未定的数据块组成。
Transfer-Encoding: chunked
每个非空的数据块之前,会有一个16进制的数值,表示这个块的长度。最后是一个大小为0的块,就表示本次回应的数据发送完了。下面是一个例子。
1 | HTTP/1.1 200 OK |
- 其他功能
HTTP1.1版本还新增了许多方法:PUT、PATCH、HEAD、OPTIONS、DELETE。并新增了Host字段,用来指定服务器的域名。 - 不足
虽然1.1版允许复用TCP连接,但是同一个TCP连接里面,所有的数据通信是按次序进行的。服务器只有处理完一个回应,才会进行下一个回应。要是前面的回应特别慢,后面就会有许多请求排队等着。这称为"队头堵塞"(Head-of-line blocking)。
为了避免这个问题,只有两种方法:一是减少请求数,二是同时多开持久连接。这导致了很多的网页优化技巧,比如合并脚本和样式表、将图片嵌入CSS代码、域名分片(domain sharding)等等。如果HTTP协议设计得更好一些,这些额外的工作是可以避免的。
SPDY协议
2009年,谷歌公开了自行研究的SPDY协议,主要结局HTTP/1.1效率不高的问题。该协议为HTTP/2奠定了基础。
HTTP/2
2015年,HTTP/2发布。
1 | 1.二进制协议 |
一次完整的http请求处理的过程
1 | 1. 建立或处理连接:接收请求或拒绝请求 |
httpd的特性
1 | 1. 高度模块化:core + modules 核心 + 模块 |
MPM的实现方式
1 | 1. perfork:多进程模型,每个进程相应一个请求; |
httpd的功能特性
1 | 1. 虚拟主机 |