Nginx相关知识
nginx是一个高性能的HTTP和反向代理服务器,也是一个通用的TCP/UDP代理服务器,是众多大型网站的必用技术。
nginx 在应用程序中的作用
 - 解决跨域
- 请求过滤
- 配置 gzip
- 负载均衡
- 静态资源服务器
正向代理与反向代理
代理是在服务器和客户端之间假设的一层服务器,代理将接收客户端的请求并将它转发给服务器,然后将服务端的响应转发给客户端。

正向代理
一个位于客户端和原始服务器 (origin server) 之间的服务器,为了从原始服务器取得内容,客户端向代理发送一个请求并指定目标 (原始服务器),然后代理向原始服务器转交请求并将获得的内容返回给客户端。
TIP
正向代理 是为我们服务的,即为客户端服务的,客户端可以根据正向代理访问到它本身无法访问到的服务器资源。
正向代理 对我们是透明的,对服务端是非透明的,即服务端并不知道自己收到的是来自代理的访问还是来自真实客户端的访问。
反向代理
是指以代理服务器来接受
internet上的连接请求,然后将请求转发给内部网络上的服务器,并将从服务器上得到的结果返回给internet上请求连接的客户端,此时代理服务器对外就表现为一个反向代理服务器。
TIP
反向代理 是为服务端服务的,反向代理可以帮助服务器接收来自客户端的请求,帮助服务器做请求转发,负载均衡等。
反向代理 对服务端是透明的,对我们是非透明的,即我们并不知道自己访问的是代理服务器,而服务器知道反向代理在为他服务。
nginx基本结构

user nginx;
worker_processes auto;
error_log /var/log/nginx/error.log;
pid /run/nginx.pid;
# Load dynamic modules. See /usr/share/nginx/README.dynamic.
include /usr/share/nginx/modules/*.conf;
events {
    worker_connections 1024;
}
http {
    server {
        listen 80;
        location  path {
            ...
        }
    }
    server {
        location  path {
            ...
        }
    }
}
- main:- nginx的全局配置,对全局生效。
- events: 配置影响- nginx服务器或与用户的网络连接。
- http:可以嵌套多个- server,配置代理,缓存,日志定义等绝大多数功能和第三方模块的配置。
- server:配置虚拟主机的相关参数,一个- http中可以有多个- server。
- location:配置请求的路由,以及各种页面的处理情况。
- upstream:配置后端服务器具体地址,负载均衡配置不可或缺的部分。
nginx内置变量
| 变量名 | 功能 | 
|---|---|
| $host | 请求信息中的 Host,如果请求中没有Host行,则等于设置的服务器名。 | 
| $request_method | 客户端请求类型如 GET、POST等。 | 
| $args | 请求中的参数。 | 
| $content_length | 请求头中的 Content-length字段。 | 
| $http_user_agent | 客户端的agent信息。 | 
| $http_cookie | 客户端的cookie信息。 | 
| $remote_addr | 客户端的 IP地址。 | 
| $remote_port | 客户端的端口。 | 
| $server_protocol | 请求使用的协议如 HTTP/1.1。 | 
| $server_addr | 服务器地址。 | 
| $server_name | 服务器名称。 | 
| $server_port | 服务器端口。 | 
解决跨域
跨域的定义
同源策略限制了从同一个源加载的文档或脚本如何与来自另一个源的资源进行交互。这是一个用于隔离潜在恶意文件的重要安全机制。通常不允许不同源间的读操作。
同源的定义
如果两个页面的协议,端口(如果有指定)和域名都相同,则两个页面具有相同的源。
nginx 解决跨域的原理
nginx对服务端转发的请求不会触发浏览器的同源策略。
- 前端 server 的域名为:fe.server.com
- 后端服务的域名为:dev.server.com
前端fe.server.com发出对dev.server.com的请求一定会出现跨域。
我们只需要启动一个 nginx 服务器,将server_name设置为fe.server.com, 然后设置相应的 location 以拦截前端需要跨域的请求,最后将请求代理回dev.server.com。如下面的配置:
server {
    listen  80;
    server_name  fe.server.com;
    location / {
        proxy_pass dev.server.com;
    }
}
nginx请求过滤
- 根据状态码过滤:
error_page 500 501 502 503 504 506 /50x.html;
location = /50x.html {
    # 将根路径改编为存放 html 的路径。
    root /root/static/html;
}
- 根据 URL 名称过滤,精准匹配 URL,不匹配的 URL 全部重定向到主页:
location / {
    rewrite  ^.*$ /index.html  redirect;
}
- 根据请求类型过滤:
if ( $request_method !~ ^(GET|POST|HEAD)$ ) {
    return 403;
}
if ( !-f $request_filename ){
    rewrite (.*) /index.js;
}
配置Gzip压缩
GZIP是规定的三种标准 HTTP 压缩格式之一。目前绝大多数的网站都在使用GZIP传输 HTML、CSS、JavaScript 等资源文件。
对于文本文件,GZip 的效果非常明显,开启后传输所需流量大约会降至 1/4 ~ 1/3。
并不是每个浏览器都支持gzip的,如何知道客户端是否支持gzip呢,请求头中的Accept-Encoding来标识对压缩的支持。

启用gzip同时需要客户端和服务端的支持,如果客户端支持gzip的解析,那么只要服务端能够返回gzip的文件就可以启用gzip了, 我们可以通过nginx的配置来让服务端支持gzip。
下面的respone中content-encoding:gzip,指服务端开启了gzip的压缩方式:

gzip                    on; // 开启或者关闭gzip模块 默认为off
gzip_http_version       1.1;// 启用 `GZip` 所需的`HTTP`最低版本 默认值为HTTP/1.1
gzip_comp_level         5; // 压缩级别,级别越高压缩率越大,当然压缩时间也就越长(传输快但比较消耗 cpu) 默认值为 1 压缩级别取值为1-9
gzip_min_length         1000;// 设置允许压缩的页面最小字节数,Content-Length小于该值的请求将不会被压缩 默认值:0  当设置的值较小时,压缩后的长度可能比原文件大,建议设置1000以上
gzip_types              text/csv text/xml text/css text/plain text/javascript application/javascript application/x-javascript application/json application/xml; // 要采用 gzip 压缩的文件类型 (MIME类型)  默认值:text/html(默认不压缩js/css)
负载均衡
负载均衡就是用来帮助我们将众多的客户端请求合理的分配到各个服务器,以达到服务端资源的充分利用和更少的请求时间。
Upstream 指定后端服务器地址列表
upstream balanceServer {
    server 10.1.22.33:12345;
    server 10.1.22.34:12345;
    server 10.1.22.35:12345;
}
在 server 中拦截响应请求,并将请求转发到 Upstream 中配置的服务器列表。
server {
    server_name  fe.server.com;
    listen 80;
    location /api {
        proxy_pass http://balanceServer;
    }
}
上面的配置只是指定了 nginx 需要转发的服务端列表,并没有指定分配策略。
- 轮询策略
默认情况下采用的策略,将所有客户端请求轮询分配给服务端。
这种策略是可以正常工作的,但是如果其中某一台服务器压力太大,出现延迟,会影响所有分配在这台服务器下的用户。
- 最小连接数策略
将请求优先分配给压力较小的服务器,它可以平衡每个队列的长度,并避免向压力大的服务器添加更多的请求。
upstream balanceServer {
    least_conn;
    server 10.1.22.33:12345;
    server 10.1.22.34:12345;
    server 10.1.22.35:12345;
}
- 最快响应时间策略
依赖于 NGINX Plus,优先分配给响应时间最短的服务器。
upstream balanceServer {
    fair;
    server 10.1.22.33:12345;
    server 10.1.22.34:12345;
    server 10.1.22.35:12345;
}
- 客户端 ip 绑定
来自同一个 ip的请求永远只分配一台服务器,有效解决了动态网页存在的 session 共享问题。
upstream balanceServer {
    ip_hash;
    server 10.1.22.33:12345;
    server 10.1.22.34:12345;
    server 10.1.22.35:12345;
}
静态资源服务器
location ~* \.(png|gif|jpg|jpeg)$ {
    root    /root/static/;  
    autoindex on;
    access_log  off;
    expires     10h;# 设置过期时间为 10 小时          
}
匹配以png|gif|jpg|jpeg为结尾的请求,并将请求转发到本地路径,root中指定的路径即 nginx 本地路径。同时也可以进行一些缓存的设置。