配置 Nginx
nginx.conf 配置文件,基本就分为以下几块:
main events { .... } http { .... upstream myproject { ..... } server { .... location { .... } } server { .... location { .... } } .... }
nginx 配置文件主要分为六个区域:
- main(全局设置)
- events(nginx 工作模式)
- http(http 设置)
- sever(主机设置)
- location(URL 匹配)
- upstream(负载均衡服务器设置)
下面依次来看下具体内容
main 模块
下面时一个 main 区域,他是一个全局的设置:
user nobody nobody; worker_processes 2; error_log /usr/local/var/log/nginx/error.log notice; pid /usr/local/var/run/nginx/nginx.pid; worker_rlimit_nofile 1024;
user 来指定 Nginx Worker 进程运行用户以及用户组,默认由 nobody 账号运行。
worker_processes 来指定了 Nginx 要开启的子进程数。每个 Nginx 进程平均耗费 10M~12M 内存。根据经验,一般指定 1 个进程就足够了,如果是多核 CPU,建议指定和 CPU 的数量一样的进程数即可。我这里写 2,那么就会开启 2 个子进程,总共 3 个进程。
error_log 用来定义全局错误日志文件。日志输出级别有 debug、info、notice、warn、error、crit 可供选择,其中,debug 输出日志最为最详细,而 crit 输出日志最少。
pid 用来指定进程 id 的存储文件位置。
worker_rlimit_nofile 用于指定一个 nginx 进程可以打开的最多文件描述符数目,这里是 65535,需要使用命令“ulimit -n 65535”来设置。
events 模块
events 模块来用指定 nginx 的工作模式和工作模式及连接数上限,一般是这样:
events { use epoll; #Linux 平台 worker_connections 1024; }
use 用来指定 Nginx 的工作模式。Nginx 支持的工作模式有 select、poll、kqueue、epoll、rtsig 和/dev/poll。其中 select 和 poll 都是标准的工作模式,kqueue 和 epoll 是高效的工作模式,不同的是 epoll 用在 Linux 平台上,而 kqueue 用在 BSD 系统中,对于 Linux 系统,epoll 工作模式是首选。
worker_connections 用于定义 Nginx 每个进程的最大连接数,即接收前端的最大请求数,默认是 1024。最大客户端连接数由 worker_processes 和 worker_connections 决定,即 Max_clients=worker_processes*worker_connections,在作为反向代理时,Max_clients 变为:Max_clients = worker_processes * worker_connections/4。 进程的最大连接数受 Linux 系统进程的最大打开文件数限制,在执行操作系统命令“ulimit -n 65536”后 worker_connections 的设置才能生效。
http 模块
http 模块可以说是最核心的模块了,它负责 HTTP 服务器相关属性的配置,它里面的 server 和 upstream 子模块,至关重要,等到反向代理和负载均衡以及虚拟目录等会仔细说。
http{ include mime.types; default_type application/octet-stream; log_format main '$remote_addr - $remote_user [$time_local] "$request" ' '$status $body_bytes_sent "$http_referer" ' '"$http_user_agent" "$http_x_forwarded_for"'; access_log /usr/local/var/log/nginx/access.log main; sendfile on; tcp_nopush on; tcp_nodelay on; keepalive_timeout 10; #gzip on; upstream myproject { ..... } server { .... } }
下面详细介绍下这段代码中每个配置选项的含义。
include 来用设定文件的 mime 类型,类型在配置文件目录下的 mime.type 文件定义,来告诉 nginx 来识别文件类型。
default_type 设定了默认的类型为二进制流,也就是当文件类型未定义时使用这种方式,例如在没有配置 asp 的 locate 环境时,Nginx 是不予解析的,此时,用浏览器访问 asp 文件就会出现下载了。
log_format 用于设置日志的格式,和记录哪些参数,这里设置为 main,刚好用于 access_log 来纪录这种类型。
main 的类型日志如下:也可以增删部分参数。
127.0.0.1 - - [21/Apr/2015:18:09:54 +0800] "GET /index.php HTTP/1.1" 200 87151 "-"
"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_2)
AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.76 Safari/537.36"
access_log
用来纪录每次的访问日志的文件地址,后面的 main 是日志的格式样式,对应于 log_format 的 main。
sendfile 参数用于开启高效文件传输模式。将 tcp_nopush 和 tcp_nodelay 两个指令设置为 on 用于防止网络阻塞。
keepalive_timeout 设置客户端连接保持活动的超时时间。在超过这个时间之后,服务器会关闭该连接。
server 模块
sever 模块是 http 的子模块,它用来定一个虚拟主机,我们先讲最基本的配置,这些在后面再讲。
我们看一下一个简单的 server 是如何做的?
server { listen 8080; server_name localhost 192.168.12.10 www.yangyi.com ; # 全局定义,如果都是这一个目录,这样定义最简单。 root /Users/yangyi/www; index index.php index.html index.htm; charset utf-8; access_log usr/local/var/log/host.access.log main; aerror_log usr/local/var/log/host.error.log error; .... }
server 标志定义虚拟主机开始。
listen 用于指定虚拟主机的服务端口。
server_name 用来指定 IP 地址或者域名,多个域名之间用空格分开。
root 表示在这整个 server 虚拟主机内,全部的 root web 根目录。注意要和 locate {}下面定义的区分开来。
index 全局定义访问的默认首页地址。注意要和 locate {}下面定义的区分开来。
charset 用于设置网页的默认编码格式。
access_log 用来指定此虚拟主机的访问日志存放路径,最后的 main 用于指定访问日志的输出格式。
- location 模块
location 模块是 nginx 中用的最多的,也是最重要的模块了,什么负载均衡啊、反向代理啊、虚拟域名啊都与它相关。慢慢来讲:
location 根据它字面意思就知道是来定位的,定位 URL,解析 URL,所以,它也提供了强大的正则匹配功能,也支持条件判断匹配,用户可以通过 location 指令实现 Nginx 对动、静态网页进行过滤处理。像我们的 php 环境搭建就是用到了它。
我们先来看这个,设定默认首页和虚拟机目录。
location / { root /Users/yangyi/www; index index.php index.html index.htm; }
location /表示匹配访问根目录。
root 指令用于指定访问根目录时,虚拟主机的 web 目录,这个目录可以是相对路径(相对路径是相对于 nginx 的安装目录)。也可以是绝对路径。
#反向代理配置 location /itcast/ { proxy_pass http://127.0.0.1:12345 ; proxy_set_header X-real-ip $remote_addr; proxy_set_header Host $http_host; } #采用 uwsgi 方式 location /python/ { include uwsgi_params; uwsgi_pass 127.0.0.1:33333; } #访问 nginx 本机目录的文件 location / { root /home/itcast/xwp/itcast/; index index.html index.htm; } location /static/ { alias /var/static/; }
- upstram 模块
upstream 模块负债负载均衡模块,通过一个简单的调度算法来实现客户端 IP 到后端服务器的负载均衡。我先学习怎么用,具体的使用实例以后再说。
upstream test.com{ ip_hash; server 192.168.123.1:80; server 192.168.123.2:80 down; server 192.168.123.3:8080 max_fails=3 fail_timeout=20s; server 192.168.123.4:8080; }
在上面的例子中,通过 upstream 指令指定了一个负载均衡器的名称 test.com。这个名称可以任意指定,在后面需要的地方直接调用即可。
里面是 ip_hash 这是其中的一种负载均衡调度算法。
Nginx 的负载均衡模块目前支持 4 种调度算法:
- weight 轮询(默认)。每个请求按时间顺序逐一分配到不同的后端服务器,如果后端某台服务器宕机,故障系统被自动剔除,使用户访问不受影响。weight。指定轮询权值,weight 值越大,分配到的访问机率越高,主要用于后端每个服务器性能不均的情况下。
- ip_hash。每个请求按访问 IP 的 hash 结果分配,这样来自同一个 IP 的访客固定访问一个后端服务器,有效解决了动态网页存在的 session 共享问题。
- fair。比上面两个更加智能的负载均衡算法。此种算法可以依据页面大小和加载时间长短智能地进行负载均衡,也就是根据后端服务器的响应时间来分配请求,响应时间短的优先分配。Nginx 本身是不支持 fair 的,如果需要使用这种调度算法,必须下载 Nginx 的 upstream_fair 模块。
- url_hash。按访问 url 的 hash 结果来分配请求,使每个 url 定向到同一个后端服务器,可以进一步提高后端缓存服务器的效率。Nginx 本身是不支持 url_hash 的,如果需要使用这种调度算法,必须安装 Nginx 的 hash 软件包。
在 HTTP Upstream 模块中,可以通过 server 指令指定后端服务器的 IP 地址和端口,同时还可以设定每个后端服务器在负载均衡调度中的状态。常用的状态有:
- down,表示当前的 server 暂时不参与负载均衡。
- backup,预留的备份机器。当其他所有的非 backup 机器出现故障或者忙的时候,才会请求 backup 机器,因此这台机器的压力最轻。
- max_fails,允许请求失败的次数,默认为 1。当超过最大次数时,返回 proxy_next_upstream 模块定义的错误。
- fail_timeout,在经历了 max_fails 次失败后,暂停服务的时间。max_fails 可以和 fail_timeout 一起使用。
注意 当负载调度算法为 ip_hash 时,后端服务器在负载均衡调度中的状态不能是 weight 和 backup。
备注: nginx 的 worker_rlimit_nofile 达到上限时,再有客户端链接报 502 错误. 用了 log_format 指令设置了日志格式之后,需要用 access_log 指令指定日志文件的存放路径。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
上一篇: 安装 Nginx
下一篇: 彻底找到 Tomcat 启动速度慢的元凶
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论