Nginx简介

概述

Nginx (“engine x”) 是一个高性能的 HTTP 和反向代理服务器,特点是占有内存少,并发能 力强,事实上 nginx 的并发能力确实在同类型的网页服务器中表现较好,中国大陆使用 nginx 网站用户有:百度、京东、新浪、网易、腾讯、淘宝等。

Nginx 可以作为静态页面的 web 服务器,同时还支持 CGI 协议的动态语言,比如 perl、php 等。但是不支持 java。Java 程序只能通过与 tomcat 配合完成。Nginx 专为性能优化而开发, 性能是其最重要的考量,实现上非常注重效率 ,能经受高负载的考验,有报告表明能支持高 达 50,000 个并发连接数。

正向代理

Nginx 不仅可以做反向代理,实现负载均衡。还能用作正向代理来进行上网等功能。 正向代理:如果把局域网外的 Internet 想象成一个巨大的资源库,则局域网中的客户端要访 问 Internet,则需要通过代理服务器来访问,这种代理服务就称为正向代理。

image-20201022190748608

反向代理

反向代理,其实客户端对代理是无感知的,因为客户端不需要任何配置就可以访问,我们只需要将请求发送到反向代理服务器,由反向代理服务器去选择目标服务器获取数据后,在返回给客户端,此时反向代理服务器和目标服务器对外就是一个服务器,暴露的是代理服务器地址,隐藏了真实服务器 IP 地址。

image-20201022191418910

负载均衡

客户端发送多个请求到服务器,服务器处理请求,有一些可能要与数据库进行交互,服 务器处理完毕后,再将结果返回给客户端。

这种架构模式对于早期的系统相对单一,并发请求相对较少的情况下是比较适合的,成 本也低。但是随着信息数量的不断增长,访问量和数据量的飞速增长,以及系统业务的复杂 度增加,这种架构会造成服务器相应客户端的请求日益缓慢,并发量特别大的时候,还容易 造成服务器直接崩溃。很明显这是由于服务器性能的瓶颈造成的问题,那么如何解决这种情况呢? 我们首先想到的可能是升级服务器的配置,比如提高 CPU 执行频率,加大内存等提高机 器的物理性能来解决此问题,但是我们知道摩尔定律的日益失效,硬件的性能提升已经不能 满足日益提升的需求了。最明显的一个例子,天猫双十一当天,某个热销商品的瞬时访问量 是极其庞大的,那么类似上面的系统架构,将机器都增加到现有的顶级物理配置,都是不能 够满足需求的。那么怎么办呢?

上面的分析我们去掉了增加服务器物理配置来解决问题的办法,也就是说纵向解决问题 的办法行不通了,那么横向增加服务器的数量呢?这时候集群的概念产生了,单个服务器解 决不了,我们增加服务器的数量,然后将请求分发到各个服务器上,将原先请求集中到单个服务器上的情况改为将请求分发到多个服务器上,将负载分发到不同的服务器,也就是我们 所说的负载均衡

image-20201022193920485

动静分离

为了加快网站的解析速度,可以把动态页面和静态页面由不同的服务器来解析,加快解析速度。降低原来单个服务器的压力。

image-20201022194026576

常用命令和配置文件

Nginx安装

默认安装目录:/usr/local/etc/nginx

Linux

# 在安装nginx前首先要确认系统中安装了gcc、pcre-devel、zlib-devel、openssl-devel。
yum -y install gcc pcre-devel zlib-devel openssl openssl-devel
# 下载“nginx-1.11.1.tar.gz”,移动到/usr/local/下
# nginx下载地址:https://nginx.org/download/
# 解压
mv nginx-1.11.1.tar.gz /usr/local/
tar -zxvf nginx-1.11.1.tar.gz
# 进入nginx目录
cd nginx-1.11.1
# 配置
./configure
# make
make && make install
# 测试是否安装成功
# cd到刚才配置的安装目录/usr/local/nginx/
./sbin/nginx -t

macOS

brew install nginx 
# 查看开放的端口号
firewall-cmd --list-all 
# 设置开放的端口号
firewall-cmd --add-service=http –permanent
sudo firewall-cmd --add-port=80/tcp --permanent
# 重启防火墙
firewall-cmd –reload

常用指令

在/usr/local/nginx/sbin (/usr/sbin/)目录下执行 ./nginx # 启动
nginx -V # 查看版本,以及配置文件地址
nginx -s reload # 重新加载配置
nginx -s reopen # 重启
nginx -s stop # 停止
nginx -s quit # 退出
nginx -v # 查看版本
nginx -c # filename 指定配置文件
nginx -h # 帮助

可能遇到的问题

  • 端口被占用

    nginx: [emerg] bind() to 0.0.0.0:80 failed (48: Address already in use)

    解决方法:修改 nginx.conf 文件里的端口号

  • 权限不够

    nginx: [alert] could not open error log file: open() “/usr/local/var/log/nginx/error.log” failed (13: Permission denied)

    解决方法:在命令前加上 sudo,这时可能会要求输入密码,密码就是电脑的开机密码啦~

cd /usr/local/cellar/nginx/1.12.1/bin
➜ bin sudo brew services start nginx
bin chmod a+x ./nginx
chmod: Unable to change file mode on ./nginx: Operation not permitted
//将nginx文件添加权限
➜  bin sudo chmod a+x ./nginx
➜  bin sudo ./nginx
nginx: [emerg] getgrnam("root") failed in /usr/local/etc/nginx/nginx.conf:2

//修改nginx.conf文件,然后重新启动nginx

➜  1.12.1 cd bin
➜  bin sudo ./nginx
➜  bin sudo nginx -s reload
➜  bin sudo nginx -s stop

配置文件

nginx 安装目录下,其默认的配置文件都放在这个目录的 conf 目录下,而主配置文件nginx.conf 也在其中,后续对 nginx 的使用基本上都是对此配置文件进行相应的修改。

第一部分:全局块

从配置文件开始到 events 块之间的内容,主要会设置一些影响 nginx 服务器整体运行的配置指令,主要包括配 置运行 Nginx 服务器的用户(组)、允许生成的 worker process 数,进程 PID 存放路径、日志存放路径和类型以 及配置文件的引入等。

这是 Nginx 服务器并发处理服务的关键配置,worker_processes 值越大,可以支持的并发处理量也越多,但是 会受到硬件、软件等设备的制约

# user  nobody;
worker_processes  1;

第二部分:events 块

events 块涉及的指令主要影响 Nginx 服务器与用户的网络连接,常用的设置包括是否开启对多 work process 下的网络连接进行序列化,是否允许同时接收多个网络连接,选取哪种事件驱动模型来处理连接请求,每个 word process 可以同时支持的最大连接数等。

上述例子就表示每个 work process 支持的最大连接数为 1024. 这部分的配置对 Nginx 的性能影响较大,在实际中应该灵活配置。

events {
	worker_connections  1024;
}

第三部分:http 块

这算是 Nginx 服务器配置中最频繁的部分,代理、缓存和日志定义等绝大多数功能和第三方模块的配置都在这里。 需要注意的是:http 块也可以包括 http 全局块、server 块。

http {
    include       mime.types;
    default_type  application/octet-stream;
    
    sendfile        on;
        
    keepalive_timeout  65;
    
    server {
        listen       80;
        server_name  api.rinshop.com;
				
				location / {
            proxy_pass http://127.0.0.1:10010;
	    			proxy_connect_timeout 600;
	    			proxy_read_timeout 600;
        }
        
        error_page 500 502 503 504 /50x.html
        location = /50x.html{
        		root html;
        }
		}	
}

这算是 Nginx 服务器配置中最频繁的部分,代理、缓存和日志定义等绝大多数功能和第三方模块的配置都在这里。 ⚠️需要注意的是:http 块也可以包括 http 全局块、server 块。

http 全局块

http 全局块配置的指令包括文件引入、MIME-TYPE 定义、日志自定义、连接超时时间、单链接请求数上限等

server 块

这块和虚拟主机有密切关系,虚拟主机从用户角度看,和一台独立的硬件主机是完全一样的,该技术的产生是为了 节省互联网服务器硬件成本

每个 http 块可以包括多个 server 块,而每个 server 块就相当于一个虚拟主机。

而每个 server 块也分为全局 server 块,以及可以同时包含多个 locaton 块。

  1. 全局 server 块

    最常见的配置是本虚拟机主机的监听配置和本虚拟主机的名称或 IP 配置

  2. location 块

    一个 server 块可以配置多个 location 块。

    这块的主要作用是基于 Nginx 服务器接收到的请求字符串(例如 server_name/uri-string),对虚拟主机名称 (也可以是 IP 别名)之外的字符串(例如 前面的 /uri-string)进行匹配,对特定的请求进行处理。地址定向、数据缓 存和应答控制等功能,还有许多第三方模块的配置也在这里进行。

nginx 配置实例

反向代理

反向代理实例一

实现效果:使用 nginx 反向代理,访问 www.123.com 直接跳转到 127.0.0.1:8080

1) 启动一个 tomcat,浏览器地址栏输入 127.0.0.1:8080,出现如下界面

2) 通过修改本地 host 文件,将 www.123.com 映射到 127.0.0.1

3) 在 nginx.conf 配置文件中增加如下配置

server {
	listen 80;
	server_name www.123.com;
	
	location / {
			proxy_pass http://127.0.0.1:8080;
			index index.html index.htm index.jsp;
	}
}

如上配置,我们监听 80 端口,访问域名为 www.123.com,不加端口号时默认为 80 端口,故 访问该域名时会跳转到 127.0.0.1:8080 路径上。在浏览器端输入 www.123.com 结果如下:

反向代理实例二

实现效果:使用 nginx 反向代理,根据访问的路径跳转到不同端口的服务中

nginx 监听端口为 9001,

访问 http://127.0.0.1:9001/edu/ 直接跳转到 127.0.0.1:8081

访问 http://127.0.0.1:9001/vod/ 直接跳转到 127.0.0.1:8082

1) 准备两个 tomcat,一个 8001 端口,一个 8002 端口,并准备好测试的页面

2) 修改 nginx 的配置文件,在 http 块中添加 server{}

server {
		listen 9001;
		server)name localhost;
		
		location ~ /edu/ {
				proxy_pass  http://localhost:8001;
		}
		
		location ~ /vod/ {
				proxy_pass  http://localhost:8002;
		}
}

location 指令说明

该指令用于匹配 URL,语法如下:

1、= :用于不含正则表达式的 uri 前,要求请求字符串与 uri 严格匹配,如果匹配 成功,就停止继续向下搜索并立即处理该请求。

2、~:用于表示 uri 包含正则表达式,并且区分大小写。

3、~*:用于表示 uri 包含正则表达式,并且不区分大小写。

4、^~:用于不含正则表达式的 uri 前,要求 Nginx 服务器找到标识 uri 和请求字 符串匹配度最高的 location 后,立即使用此 location 处理请求,而不再使用 location块中的正则 uri 和请求字符串做匹配。

⚠️ 注意:如果 uri 包含正则表达式,则必须要有 ~ 或者 ~* 标识。

负载均衡

1) 首先准备两个同时启动的Tomcat

2) 在nginx.conf中进行配置

image-20201022210805149

随着互联网信息的爆炸性增长,负载均衡(load balance)已经不再是一个很陌生的话题, 顾名思义,负载均衡即是将负载分摊到不同的服务单元,既保证服务的可用性,又保证响应 足够快,给用户很好的体验。快速增长的访问量和数据流量催生了各式各样的负载均衡产品, 很多专业的负载均衡硬件提供了很好的功能,但却价格不菲,这使得负载均衡软件大受欢迎, nginx 就是其中的一个,在 linux 下有 Nginx、LVS、Haproxy 等等服务可以提供负载均衡服 务,而且 Nginx 提供了几种分配方式(策略):

轮询(默认)

每个请求按时间顺序逐一分配到不同的后端服务器,如果后端服务器 down 掉,能自动剔除。

weight

weight 代表权,重默认为 1,权重越高被分配的客户端越多 指定轮询几率,weight 和访问比率成正比,用于后端服务器性能不均的情况。 例如:

upstream server_pool{
	in_hash;
	server 192.168.5.21:80;
	server 192.168.5.22:80;
}

fair(第三方)

按后端服务器的响应时间来分配请求,响应时间短的优先分配

upstream server_pool{
	server 192.168.5.21:80;
	server 192.168.5.22:80;
	fair;
}

动静分离

Nginx 动静分离简单来说就是把动态跟静态请求分开,不能理解成只是单纯的把动态页面和 静态页面物理分离。严格意义上说应该是动态请求跟静态请求分开,可以理解成使用 Nginx 处理静态页面,Tomcat 处理动态页面。动静分离从目前实现角度来讲大致分为两种:

  1. 纯粹把静态文件独立成单独的域名,放在独立的服务器上,也是目前主流推崇的方案;

  2. 动态跟静态文件混合在一起发布,通过 nginx 来分开。

expires 参数

通过 location 指定不同的后缀名实现不同的请求转发。通过 expires 参数设置,可以使 浏览器缓存过期时间,减少与服务器之前的请求和流量。

  1. 具体 Expires 定义:是给一个资源设定一个过期时间,也就是说无需去服务端验证,直接通过浏览器自身确认是否过期即可, 所以不会产生额外的流量。此种方法非常适合不经常变动的资源。

  2. 如果经常更新的文件, 不建议使用 Expires 来缓存,我这里设置 3d,表示在这 3 天之内访问这个 URL,发送 一个请求,比对服务器该文件最后更新时间没有变化,则不会从服务器抓取,返回状态码 304,如果有修改,则直接从服务器重新下载,返回状态码 200。

# 文件路径: /data/www /data/image
# 最后检查 Nginx 配置是否正确即可,然后测试动静分离是否成功,之需要删除后端 tomcat服务器上的某个静态文件,查看是否能访问,如果可以访问说明静态资源 nginx 直接返回了,不走后端 tomcat 服务器
server{
		listen 80;
		server_name 192.168.17.129;
		
		location /www/ {
				root /data/;
				index index.html index.htm; # 每当访问一个文件夹,先找index,找不到就找index.html找不到再找index.htm 找不到就不找了。
		}
		
		location /image/ {
				root /data/;
				autoindex on; # 列出当前文件夹中的内容
		}
}

搭建高可用集群

image-20201023100638766

主从模式

准备工作

  1. 需要两台服务器 192.168.209.134 和 192.168.209.135

  2. 在两台服务器安装 nginx

  3. 在两台服务器安装 keepalived

     # 安装之后,在 /etc 里面生成目录 keepalived,有文件 keepalived.conf
    yum install keepalived -y
    
  4. 修改/etc/keepalived/keepalivec.conf 配置文件

主服务器:

! Configuration File for keepalived
# 全局配置
global_defs { 
	notification_email { 
		acassen@firewall.loc 
		failover@firewall.loc 
		sysadmin@firewall.loc
}
	notification_email_from Alexandre.Cassen@firewall.loc 
	smtp_server 192.168.209.134 
	smtp_connect_timeout 30
	router_id LVS_DEVEL   # 唯一标示,能通过该名字访问到主机。需在hosts文件配置中 127.0.0.1 LVS_DEVEL
}

# 脚本配置
vrrp_script chk_http_port {
	script "/usr/local/src/nginx_check.sh"
	interval 2 #(检测脚本执行的间隔)
	weight 2 
}

# 虚拟ip配置
vrrp_instance VI_1 {
	state MASTER # 备份服务器上将 MASTER 改为 BACKUP
	interface eno16777736 # 在哪个网卡上绑定虚拟ip
	virtual_router_id 51 # 主、备机的 virtual_router_id 必须相同
	priority 100 # 主、备机取不同的优先级,主机值较大,备份机值较小 
	advert_int 1 # 每隔多少时间间隔 发送心跳 默认1s
	
	authentication { # 权限校验方式
		auth_type PASS
		auth_pass 1111 
		}
	virtual_ipaddress {
		192.168.209.50  # VRRP H 虚拟地址
	} 
}

从服务器:

! Configuration File for keepalived
# 全局配置
global_defs { 
	notification_email { 
		acassen@firewall.loc 
		failover@firewall.loc 
		sysadmin@firewall.loc
}
	notification_email_from Alexandre.Cassen@firewall.loc 
	smtp_server 192.168.209.135 
	smtp_connect_timeout 30
	router_id LVS_DEVEL   # 唯一标示
}

# 脚本配置
vrrp_script chk_http_port {
	script "/usr/local/src/nginx_check.sh"
	interval 2 #(检测脚本执行的间隔)
	weight 2 
}

# 虚拟ip配置
vrrp_instance VI_1 {
	state BACKUP # 备份服务器上将 MASTER 改为 BACKUP
	interface eno16777736 # 在哪个网卡上绑定虚拟ip
	virtual_router_id 51 # 主、备机的 virtual_router_id 必须相同
	priority 90 # 主、备机取不同的优先级,主机值较大,备份机值较小 
	advert_int 1
	
	authentication { 
		auth_type PASS
		auth_pass 1111 
		}
	virtual_ipaddress {
		192.168.209.50  # VRRP H 虚拟地址
	} 
}
  1. 在/usr/local/src 添加检测脚本
#!/bin/bash
A=`ps -C nginx ¨Cno-header |wc -l`
if [ $A -eq 0 ];then
    /usr/local/nginx/sbin/nginx  # nginx启动脚本位置
    sleep 2
    if [ `ps -C nginx --no-header |wc -l` -eq 0 ];then
        killall keepalived  # 若果nginx宕机了,把keepalived所有进程杀死。从服务器便可替代它
    fi
fi
  1. 把两台服务器上 nginx 和 keepalived 启动
./nginx # 启动 nginx
systemctl start keepalived.service # 启动 keepalived

测试

1)在浏览器地址栏输入 虚拟 ip 地址 192.168.209.50

2)把主服务器(192.168.209.134)nginx 和 keepalived 停止,再输入 192.168.209.50

./nginx -s stop

可输入ip addr查看网卡信息:

image-20201023133524100

双主模式

image-20201023135814238

说明:还是按照上面的环境继续做实验,只是修改 LB 节点上面的 keepalived 服务的配置文件即可。此时192.168.209.134 节点即为 Keepalived 的主节点也为备节点,192.168.209.135 节点同样即为 Keepalived 的主节点也为备节点。

192.168.209.134:编辑配置文件,增加一段新的vrrp_instance 规则

# 虚拟ip配置
vrrp_instance VI_1 {
	state MASTER # 备份服务器上将 MASTER 改为 BACKUP
	interface eno16777736 # 在哪个网卡上绑定虚拟ip
	virtual_router_id 51 # 主、备机的 virtual_router_id 必须相同
	priority 150 # 主、备机取不同的优先级,主机值较大,备份机值较小 
	advert_int 1
	
	authentication { 
		auth_type PASS
		auth_pass 1111 
		}
	virtual_ipaddress {
		192.168.209.110/24 dev eno16777736 label eno16777736:1  # VRRP H 虚拟地址
	} 
}

vrrp_instance VI_2 { 
		state BACKUP
    interface eno16777736
    virtual_router_id 52
    priority 100
    advert_int 1
    authentication {
    	auth_type PASS
    	auth_pass 2222
}
		virtual_ipaddress {
			192.168.209.210/24 dev eno16777736 label eno16777736:2 
		}
}

192.168.209.135:编辑配置文件,增加一段新的vrrp_instance 规则

# 虚拟ip配置
vrrp_instance VI_1 {
	state BACKUP # 备份服务器上将 MASTER 改为 BACKUP
	interface eno16777736 # 在哪个网卡上绑定虚拟ip
	virtual_router_id 51 # 主、备机的 virtual_router_id 必须相同
	priority 100 # 主、备机取不同的优先级,主机值较大,备份机值较小 
	advert_int 1
	
	authentication { 
		auth_type PASS
		auth_pass 1111 
		}
	virtual_ipaddress {
		192.168.209.110/24 dev eno16777736 label eno16777736:1  # VRRP H 虚拟地址
	} 
}

vrrp_instance VI_2 { 
		state MASTER
    interface eno16777736
    virtual_router_id 52
    priority 150
    advert_int 1
    authentication {
    	auth_type PASS
    	auth_pass 2222
}
		virtual_ipaddress {
			192.168.209.210/24 dev eno16777736 label eno16777736:2 
		}
}

nginx 原理与优化参数配置

master-workers 的机制

首先,对于每个 worker 进程来说,独立的进程,不需要加锁,所以省掉了锁带来的开销, 同时在编程以及问题查找时,也会方便很多。其次,采用独立的进程,可以让互相之间不会 影响,一个进程退出后,其它进程还在工作,服务不会中断,master 进程则很快启动新的 worker 进程。当然,worker 进程的异常退出,肯定是程序有 bug 了,异常退出,会导致当 前 worker 上的所有请求失败,不过不会影响到所有请求,所以降低了风险。

一个 master 和多个 woker 有好处:

  • 可以使用 nginx –s reload 热部署,利用 nginx 进行热部署操作
  • 每个 woker 是独立的进程,如果有其中的一个 woker 出现问题,其他 woker 独立的, 继续进行争抢,实现请求过程,不会造成服务中断

image-20201023095121223

需要设置多少个 worker

Nginx 同 redis 类似都采用了 io 多路复用机制,每个 worker 都是一个独立的进程,但每个进程里只有一个主线程,通过异步非阻塞的方式来处理请求, 即使是千上万个请求也不在话下。每个 worker 的线程可以把一个 cpu 的性能发挥到极致。所以 worker 数和服务器的 cpu 数相等是最为适宜的。设少了会浪费 cpu,设多了会造成 cpu 频繁切换上下文带来的损耗。

# 设置 worker 数量。
worker_processes 4
# work 绑定 cpu(4 work 绑定 4cpu)。 
worker_cpu_affinity 0001 0010 0100 1000
# work 绑定 cpu (4 work 绑定 8cpu 中的 4 个) 。 
worker_cpu_affinity 0000001 00000010 00000100 00001000

连接数 worker_connection

这个值是表示每个 worker 进程所能建立连接的最大值,所以,一个 nginx 能建立的最大连数,应该是 worker_connections * worker_processes。当然,这里说的是最大连接数,

  • 对于 HTTP 请求本地资源来说,能够支持的最大并发数量是 worker_connections * worker_processes

  • 如果是支持 http1.1 的浏览器每次访问要占两个连接,所以普通的静态访问最大并发数是: (worker_connections * worker_processes) /2,
  • 如果是 HTTP 作为反向代理来说,最大并发数量应该是( worker_connections * worker_processes)/4。

image-20201023145941257

⚠️因为作为反向代理服务器,每个并发会建立与客户端的连接和与后端服务的连接,会占用两个连接。

image-20201023170553022