计算机网络之 HTTP 协议

发布于 2024-01-29 14:48:41 字数 4419 浏览 26 评论 0

HTTP 的全称是 HyperText Transfer Protocol，中文是超文本传输协议。它是一个应用层协议，底层使用 TCP 协议来传输，这就是说，在使用 HTTP 发起请求前，需要先建立 TCP 链接，也就是三次握手，然后才能传输数据。

HTTP 的发展历程

0.9 版本发布于 1991 年，1.0 版本发布于 1996 年。这两个版本就是简单的 request-response 模式，其中 0.9 版本只支持 GET 方法，后来 1.0 版本进行了一些扩展，增加了：

HTTP1.0 可以说是比较书面意义的一份规范，让 HTTP 更加规范化了，但是这个版本有个很大问题，每请求一次资源都要新建 TCP 连接，而且是串行请求。

HTTP/1.1 发布于 1999 年，在 1.0 的基础上，解决了一些网络性能问题，另外增加了新特性：

持久链接：通过设置 keep-alive 来重用 TCP 连接
支持 pipeline 网络传输，第一个请求发出了，可以接着发第二个请求出去
增加了 Cache-Control 缓存控制
协议头注增加了 Language, Encoding, Type 等
数据分块传输，这是因为如果页面内容是动态生成的，浏览器不知道何时才能接收完毕，于是服务器将数据分割成多个 chunk，每次发送时附上上次数据块的长度，最后通过发送零长度的块作为数据发送完毕的标志
强制要求 host 头，以便让服务器知道要请求哪个网站，因为存在多个域名解析到同一个 ip 上，要区分具体域名
增加了 PUT、DELETE、OPTIONS 等方法，其中 OPTIONS 常用于 CORS
引入了客户端 cookie

了解 HTTP/2 之前，先看 HTTP/1.1 还有哪些缺点:

所以在 2010 年的时候，Google 就在搞一个实验型的协议：SPDY。这个协议后来成为了 HTTP/2 的基础，HTTP/2 发布于 2015 年，它带来了许多新的特性：

以下是 HTTP/2 与 HTTP/1.1 的对比：

黑客的世界就是不断的折腾，HTTP/2 看起来已经完美了，但还是存在问题：多个 HTTP 请求在复用一个 TCP 链接，如果发生丢包，那所有的 HTTP 请求都必须等待这个被丢了的包重传回来，这还是存在队头阻塞问题，只不过现在是 TCP 的问题。

那既然 TCP 有问题，就干脆放弃掉它！所以 Google 另起炉灶搞了个 QUIC，它抛弃了 HTTP 底层的 TCP，改用 UDP。后台这个协议又又成为了 HTTP/3 的基础。HTTP/3 发布于 2018 年，它的特性如下：

可以说，HTTP/3 是在 UDP 上组合了 TCP + TLS + HTTP/2 的功能，由于动了底层协议，它离大规模应用还很遥远。

HTTP 是基于客户端-服务器模型的，客户端发送请求，服务端响应请求。请求和响应都由以下部分组成：

包含请求方法、状态码、路径和版本，如 GET 200 /index.html HTTP/1.1
请求方法包含：

其中 Get 和 Post 的区别有：

从缓存的角度，get 可以被缓存，post 不会
从编码角度，get 只能进行 url 编码，接收 ASCII 字符；post 没有限制
从参数角度，get 请求参数在 url 中；而 post 则是放在 body 里
从幂等性角度，get 是幂等的，post 是不幂等
从 TCP 角度，get 会一次性把请求报文发送出去；而 post 则会分为两个 TCP 包，先发送 header 部分，如果服务器响应 100；再继续发送 body 部分

状态码主要有 1xx ， 2xx ， 3xx ， 4xx ， 5xx 几种
1 xx：请求接收，继续处理