返回介绍

1.4.2 HTTP 协议基础

发布于 2022-02-28 21:35:50 字数 16336 浏览 878 评论 0 收藏 0

什么是 HTTP

HTTP 是 Web 领域的核心通信协议。最初的 HTTP 支持基于文本的静态资源获取,随着协议版本的不断迭代,它已经支持如今常见的复杂分布式应用程序。

HTTP 使用一种基于消息的模型,建立于 TCP 层之上。由客户端发送一条请求消息,而后由服务器返回一条响应消息。

HTTP 请求与响应

一次完整的请求或响应由消息头、一个空白行和消息主体构成。以下是一个典型的 HTTP 请求:

GET / HTTP/1.1
Host: www.github.com
User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:52.0) Gecko/20100101 Firefox/52.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: zh-CN,zh;q=0.8,en-US;q=0.5,en;q=0.3
Accept-Encoding: gzip, deflate
Upgrade-Insecure-Requests: 1
Cookie: logged_in=yes;
Connection: close

第一行分别是请求方法,请求的资源路径和使用的 HTTP 协议版本,第二至九行为消息头键值对。

以下是对上面请求的回应(并不一定和真实访问相同,这里只是做为示例):

HTTP/1.1 200 OK
Date: Tue, 26 Dec 2017 02:28:53 GMT
Content-Type: text/html; charset=utf-8
Connection: close
Server: GitHub.com
Status: 200 OK
Cache-Control: no-cache
Vary: X-PJAX
X-UA-Compatible: IE=Edge,chrome=1
Set-Cookie: user_session=37Q; path=/;
X-Request-Id: e341
X-Runtime: 0.538664
Content-Security-Policy: default-src 'none';
Strict-Transport-Security: max-age=31536000; includeSubdomains; preload
Public-Key-Pins: max-age=0;
X-Content-Type-Options: nosniff
X-Frame-Options: deny
X-XSS-Protection: 1; mode=block
X-Runtime-rack: 0.547600
Vary: Accept-Encoding
X-GitHub-Request-Id: 7400
Content-Length: 128504

<!DOCTYPE html>
......

第一行为协议版本、状态号和对应状态的信息,第二至二十二为返回头键值对,紧接着为一个空行和返回的内容实体。

HTTP 方法

在提到 HTTP 方法之前,我们需要先讨论一下 HTTP 版本问题。HTTP 协议现在共有三个大版本,版本差异会导致一些潜在的漏洞利用方式。

版本简述
HTTP 0.9该版本只允许 GET 方法,具有典型的无状态性,无协议头和状态码,支持纯文本
HTTP 1.0增加了 HEAD 和 POST 方法,支持长连接、缓存和身份认证
HTTP 1.1增加了 Keep-alive 机制和 PipeLining 流水线,新增了 OPTIONS、PUT、DELETE、TRACE、CONNECT 方法
HTTP 2.0增加了多路复用、头部压缩、随时复位等功能
请求方法描述
GET请求获取 URL 资源
POST执行操作,请求 URL 资源后附加新的数据
HEAD只获取资源响应消息报头
PUT请求服务器存储一个资源
DELETE请求服务器删除资源
TRACE请求服务器回送收到的信息
OPTIONS查询服务器的支持选项

URL

URL 是统一资源定位符,它代表了 Web 资源的唯一标识,如同电脑上的盘符路径。最常见的 URL 格式如下所示:

protocol://[user[:password]@]hostname[:post]/[path]/file[?param=value]
协议   分隔符   用户信息        域名      端口   路径   资源文件   参数键   参数值

下面是一张具体案例分析

img

HTTP 消息头

HTTP 支持许多不同的消息头,一些有着特殊作用,而另一些则特定出现在请求或者响应中。

消息头描述备注
Connection告知通信另一端,在完成HTTP传输后是关闭 TCP 连接,还是保持连接开放
Content-Encoding规定消息主体内容的编码形式
Content-Length规定消息主体的字节长度
Content-Type规定消息主体的内容类型
Accept告知服务器客户端愿意接受的内容类型请求
Accept-Encoding告知服务器客户端愿意接受的内容编码请求
Authorization进行内置 HTTP 身份验证请求
Cookie用于向服务器提交 cookie请求
Host指定所请求的完整 URL 中的主机名称请求
Origin跨域请求中的请求域请求
Referer指定提出当前请求的原始 URL请求
User-Agent提供浏览器或者客户端软件的有关信息请求
Cache-Control向浏览器发送缓存指令响应
Location重定向响应响应
Server提供所使用的服务器软件信息响应
Set-Cookie向浏览器发布 cookie响应
WWW-Authenticate提供服务器支持的验证信息响应

Cookie

Cookie 是大多数 Web 应用程序所依赖的关键组成部分,它用来弥补 HTTP 的无状态记录的缺陷。服务器使用 Set-Cookie 发布 cookie,浏览器获取 cookie 后每次请求会在 Cookie 字段中包含 cookie 值。

Cookie 是一组键值对,另外还包括以下信息:

  • expires,用于设定 cookie 的有效时间。
  • domain,用于指定 cookie 的有效域。
  • path,用于指定 cookie 的有效 URL 路径。
  • secure,指定仅在 HTTPS 中提交 cookie。
  • HttpOnly,指定无法通过客户端 JavaScript 直接访问 cookie。

状态码

状态码表明资源的请求结果状态,由三位十进制数组成,第一位代表基本的类别:

  • 1xx,提供信息
  • 2xx,请求成功提交
  • 3xx,客户端重定向其他资源
  • 4xx,请求包含错误
  • 5xx,服务端执行遇到错误

常见的状态码及短语如下所示:

状态码短语描述
100Continue服务端已收到请求并要求客户端继续发送主体
200Ok已成功提交,且响应主体中包含请求结果
201CreatedPUT 请求方法的返回状态,请求成功提交
301Moved Permanently请求永久重定向
302Found暂时重定向
304Not Modified指示浏览器使用缓存中的资源副本
400Bad Request客户端提交请求无效
401Unauthorized服务端要求身份验证
403Forbidden禁止访问被请求资源
404Not Found所请求的资源不存在
405Method Not Allowed请求方法不支持
413Request Entity Too Large请求主体过长
414Request URI Too Long请求URL过长
500Internal Server Error服务器执行请求时遇到错误
503Service UnavailableWeb 服务器正常,但请求无法被响应

401 状态支持的 HTTP 身份认证:

  • Basic,以 Base64 编码的方式发送证书
  • NTLM,一种质询-响应机制
  • Digest,一种质询-响应机制,随同证书一起使用一个随机的 MD5 校验和

HTTPS

HTTPS 用来弥补 HTTP 明文传输的缺陷。通过使用安全套接字 SSL,在端与端之间传输加密后的消息,保护传输数据的隐密性和完整性,并且原始的 HTTP 协议依然按照之前同样的方式运作,不需要改变。

参考资料

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文