nginx安装和配置详解

安装

nginx下载地址：http://nginx.org/en/download.html
Windows直接选择合适的版本下载，解压后双击nginx.exe执行，访问http://localhost即可
Linux下载安装可以查看我这篇文章：Linux下安装和使用Nginx

配置

nginx.conf配置文件,基本就分为以下几块：

main
events   {
  ....
}
http        {
  ....
  upstream myproject {
    .....
  }
  server  {
    ....
    location {
        ....
    }
  }
  server  {
    ....
    location {
        ....
    }
  }
  ....
}

nginx配置文件主要分为六个区域：

main(全局设置)
events(nginx工作模式)
http(http设置)
sever(主机设置)
location(URL匹配)
upstream(负载均衡服务器设置)

下面依次来看下具体内容

main模块

下面时一个main区域，他是一个全局的设置：

user nobody nobody;
worker_processes 2;
error_log  /usr/local/var/log/nginx/error.log  notice;
pid        /usr/local/var/run/nginx/nginx.pid;
worker_rlimit_nofile 65535;

**user： **来指定Nginx Worker进程运行用户以及用户组，默认由nobody账号运行。
**worker_processes：**来指定了Nginx要开启的子进程数。每个Nginx进程平均耗费10M~12M内存。根据经验，一般指定1个进程就足够了，如果是多核CPU，建议指定和CPU的数量一样的进程数即可。我这里写2，那么就会开启2个子进程，总共3个进程。
**error_log：**用来定义全局错误日志文件。日志输出级别有debug、info、notice、warn、error、crit可供选择，其中，debug输出日志最为最详细，而crit输出日志最少。
**pid：**用来指定进程id的存储文件位置。
**worker_rlimit_nofile：**用于指定一个nginx进程可以打开的最多文件描述符数目，这里是65535，需要使用命令“ulimit -n 65535”来设置。

events 模块

events模块来用指定nginx的工作模式和工作模式及连接数上限，一般是这样：

events {
    use epoll; #Linux平台
    worker_connections  1024;
}

use用来指定Nginx的工作模式。Nginx支持的工作模式有select、poll、kqueue、epoll、rtsig和/dev/poll。其中select和poll都是标准的工作模式，kqueue和epoll是高效的工作模式，不同的是epoll用在Linux平台上，而kqueue用在BSD系统中,对于Linux系统，epoll工作模式是首选。
worker_connections用于定义Nginx每个进程的最大连接数，即接收前端的最大请求数，默认是1024。最大客户端连接数由worker_processes和worker_connections决定，即Max_clients=worker_processes*worker_connections，在作为反向代理时，Max_clients变为：Max_clients = worker_processes * worker_connections/4。进程的最大连接数受Linux系统进程的最大打开文件数限制，在执行操作系统命令“ulimit -n 65536”后worker_connections的设置才能生效。

http 模块

http模块可以说是最核心的模块了，它负责HTTP服务器相关属性的配置，它里面的server和upstream子模块，至关重要，等到反向代理和负载均衡以及虚拟目录等会仔细说。

http{
    include       mime.types;
    default_type  application/octet-stream;
    log_format  main  '$remote_addr - $remote_user [$time_local] "$request" '
                      '$status $body_bytes_sent "$http_referer" '
                      '"$http_user_agent" "$http_x_forwarded_for"';
    access_log  /usr/local/var/log/nginx/access.log  main;
    sendfile        on;
    tcp_nopush      on;
    tcp_nodelay     on;
    keepalive_timeout  10;
    #gzip  on;
    upstream myproject {
        .....
    }
    server {
        ....
    }
}

下面详细介绍下这段代码中每个配置选项的含义。
include： 用来设定文件的mime类型,类型在配置文件目录下的mime.type文件定义，来告诉nginx来识别文件类型。
**default_type：**设定了默认的类型为二进制流，也就是当文件类型未定义时使用这种方式，例如在没有配置asp 的locate 环境时，Nginx是不予解析的，此时，用浏览器访问asp文件就会出现下载了。
**log_format：**用于设置日志的格式，和记录哪些参数，这里设置为main，刚好用于access_log来纪录这种类型。
main的类型日志如下：也可以增删部分参数。

127.0.0.1 - - [21/Apr/2022:18:09:54 +0800] “GET /index.php HTTP/1.1” 200 87151 “-” “Mozilla/5.0 (Macintosh; Intel Mac OS X 10_10_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/41.0.2272.76 Safari/537.36”

**access_log：**用来纪录每次的访问日志的文件地址，后面的main是日志的格式样式，对应于log_format的main。
**sendfile：**参数用于开启高效文件传输模式。将tcp_nopush和tcp_nodelay两个指令设置为on用于防止网络阻塞。
**keepalive_timeout：**设置客户端连接保持活动的超时时间。在超过这个时间之后，服务器会关闭该连接。

server 模块

sever 模块是http的子模块，它用来定一个虚拟主机，我们先讲最基本的配置，这些在后面再讲。
我们看一下一个简单的server 是如何做的？

server {
        listen       8080;
        server_name  localhost 192.168.12.10 www.zjq.com;
        # 全局定义，如果都是这一个目录，这样定义最简单。
        root   /Users/zjq/www;
        index  index.php index.html index.htm; 
        charset utf-8;
        access_log  usr/local/var/log/host.access.log  main;
        aerror_log  usr/local/var/log/host.error.log  error;
        ....
}

server：标志定义虚拟主机开始。
listen：用于指定虚拟主机的服务端口。
server_name：用来指定IP地址或者域名，多个域名之间用空格分开。
root：表示在这整个server虚拟主机内，全部的root web根目录。注意要和locate {}下面定义的区分开来。
index：全局定义访问的默认首页地址。注意要和locate {}下面定义的区分开来。
charset：用于设置网页的默认编码格式。
access_log：用来指定此虚拟主机的访问日志存放路径，最后的main用于指定访问日志的输出格式。

location 模块

location模块是nginx中用的最多的，也是最重要的模块了，什么负载均衡啊、反向代理啊、虚拟域名啊都与它相关。
location 根据它字面意思就知道是来定位的，定位URL，解析URL，所以，它也提供了强大的正则匹配功能，也支持条件判断匹配，用户可以通过location指令实现Nginx对动、静态网页进行过滤处理。
我们先来看这个，设定默认首页和虚拟机目录。

location / {
  root   /users/zjq/www;
  index  index.php index.html index.htm;
}

location /表示匹配访问根目录。
root指令用于指定访问根目录时，虚拟主机的web目录，这个目录可以是相对路径（相对路径是相对于nginx的安装目录）。也可以是绝对路径。

#反向代理配置
location /zjq/ {
  proxy_pass http://127.0.0.1:12345;
  proxy_set_header X-real-ip $remote_addr;
  proxy_set_header Host $http_host;
}


#采用uwsgi方式
location /python/ {
  include uwsgi_params;
  uwsgi_pass 127.0.0.1:33333;
}



#访问nginx本机目录的文件
location / {
  root   /home/zjq/;
  index  index.html index.htm;
}

location  /static/ {
  alias /var/static/;
}

upstram 模块

upstream 模块是负载均衡模块，通过一个简单的调度算法来实现客户端IP到后端服务器的负载均衡。

upstream test.com{
    ip_hash;
    server 192.168.123.1:80;
    server 192.168.123.2:80 down;
    server 192.168.123.3:8080  max_fails=3  fail_timeout=20s;
    server 192.168.123.4:8080;
}

在上面的例子中，通过upstream指令指定了一个负载均衡器的名称test.com。这个名称可以任意指定，在后面需要的地方直接调用即可。
里面是ip_hash这是其中的一种负载均衡调度算法。
Nginx的负载均衡模块目前支持4种调度算法:

weight 轮询（默认）。每个请求按时间顺序逐一分配到不同的后端服务器，如果后端某台服务器宕机，故障系统被自动剔除，使用户访问不受影响。weight。指定轮询权值，weight值越大，分配到的访问机率越高，主要用于后端每个服务器性能不均的情况下。
ip_hash。每个请求按访问IP的hash结果分配，这样来自同一个IP的访客固定访问一个后端服务器，有效解决了动态网页存在的session共享问题。
fair。比上面两个更加智能的负载均衡算法。此种算法可以依据页面大小和加载时间长短智能地进行负载均衡，也就是根据后端服务器的响应时间来分配请求，响应时间短的优先分配。Nginx本身是不支持fair的，如果需要使用这种调度算法，必须下载Nginx的upstream_fair模块。
url_hash。按访问url的hash结果来分配请求，使每个url定向到同一个后端服务器，可以进一步提高后端缓存服务器的效率。Nginx本身是不支持url_hash的，如果需要使用这种调度算法，必须安装Nginx 的hash软件包。

在HTTP Upstream模块中，可以通过server指令指定后端服务器的IP地址和端口，同时还可以设定每个后端服务器在负载均衡调度中的状态。常用的状态有：
down，表示当前的server暂时不参与负载均衡。
backup，预留的备份机器。当其他所有的非backup机器出现故障或者忙的时候，才会请求backup机器，因此这台机器的压力最轻。
max_fails，允许请求失败的次数，默认为1。当超过最大次数时，返回proxy_next_upstream 模块定义的错误。
fail_timeout，在经历了max_fails次失败后，暂停服务的时间。max_fails可以和fail_timeout一起使用。
注意当负载调度算法为ip_hash时，后端服务器在负载均衡调度中的状态不能是weight和backup。
备注： nginx的worker_rlimit_nofile达到上限时，再有客户端链接报502错误. 用了log_format指令设置了日志格式之后，需要用access_log指令指定日志文件的存放路径.

反向代理

正向代理，也就是传说中的代理,他的工作原理就像一个跳板，简单的说，我是一个用户，我访问不了某网站，但是我能访问一个代理服务器，这个代理服务器呢，他能访问那个我不能访问的网站，于是我先连上代理服务器，告诉他我需要那个无法访问网站的内容，代理服务器去取回来，然后返回给我。从网站的角度，只在代理服务器来取内容的时候有一次记录，有时候并不知道是用户的请求，也隐藏了用户的资料，这取决于代理告不告诉网站。结论就是，正向代理是一个位于客户端和原始服务器(origin server)之间的服务器，为了从原始服务器取得内容，客户端向代理发送一个请求并指定目标(原始服务器)，然后代理向原始服务器转交请求并将获得的内容返回给客户端。客户端必须要进行一些特别的设置才能使用正向代理。
**反向代理（Reverse Proxy）**方式是指以代理服务器来接受internet上的连接请求，然后将请求转发给内部网络上的服务器，并将从服务器上得到的结果返回给internet上请求连接的客户端，此时代理服务器对外就表现为一个反向代理服务器。
从用途上来讲：

正向代理的典型用途是为在防火墙内的局域网客户端提供访问Internet的途径。
正向代理还可以使用缓冲特性减少网络使用率。反向代理的典型用途是将防火墙后面的服务器提供给Internet用户访问。
反向代理还可以为后端的多台服务器提供负载平衡，或为后端较慢的服务器提供缓冲服务。
另外，反向代理还可以启用高级URL策略和管理技术，从而使处于不同web服务器系统的web页面同时存在于同一个URL空间下。

反向代理服务器的基本配置

proxy_pass

proxy_pass URL;
配置块 location if
此配置将当前请求代理到URL参数指定的服务器上,URL可以是主机名或者IP地址加PORT的形式
proxy_pass http://localhost:8000;
也可以结合负载均衡实用<负载均衡会说明这种情况>
也可以吧HTTP转换成HTTPS
proxy_pass http://192.168.0.1;
默认情况反向代理不转发请求中的Host头部,如果需要设置转发头部
则 proxy_set_header Host $host;

proxy_method

proxy_method method_name;
配置块 http server location
此配置项表示转发时的协议方法名:
proxy_method POST;
那么客户端发来的GET请求在转发时方法改为POST;

proxy_hide_header

proxy_hide_header header1;
配置块 http server location;
Nginx会将上游服务器的响应转发给客户端,但默认不转发HTTP头部字段(Date Server X-Pad X-Accel-* )
使用proxy_hide_header可以指定任意头部不能被转发
proxy_hide_header Cache-Control;
proxy_hide_header MicrosoftOfficeWebServer;

proxy_pass_header

proxy_pass_header header1;
配置块 http server location
功能与 proxy_hide_header相反,是设置哪些头部允许转发.
proxy_pass_header X-Accel-Redirect;

proxy_pass_request_body

proxy_pass_request_body off|on;
默认 on
配置块 http server location;
确定上游服务器是否向上游服务器转发HTTP包体

proxy_pass_request_header

proxy_pass_request_header on | off;
默认on
配置块 http server location
确定是否转发HTTP头部

proxy_redirect

proxy_redirect [default | off |redirect |replacement]
默认default
配置块 http server location
当上游服务响应时重定向或刷新(HTTP 301 302),proxy_redirect可以重设HTTP头部的location或refresh字段

proxy_redirect http://locahost:8000/two/ http://frontend/one/;
上游响应302,location是URI是http://locahost:8000/two/some/uri/
那是实际转发给客户端的是 http://frontend/one/some/uri/;
可以使用前面提到的ngx_http_core_module模块提供的变量 
proxy_redirect http://locahost:8000/two/ http://$host:server_port/;
可以省略replacement参数的主机名部分,这时候用虚拟主机名填充
proxy_redirect http://locahost:8000/two/ /one/;

使用off参数的时候,将使location和refresh的字段维持不变
proxy_redirect off;

如果使用的 proxy_redirect default;
下面两种配置是等效的
location /{
  proxy_pass http://upstream:port/two/;
  proxy_redirect default;
}
location /{
  proxy_pass http://upstream:port/two/;
  proxy_redirect http://upstream:port/two/ /one/;
}

proxy_next_upstream

proxy_next_upstream [error |timeout |invalid_header |http_500 |http_502~504 |http_404 | off]
默认 proxy_next_upstream error timeout;
配置块 http server location

此配置表示上游一台服务器转发请求出现错误时,继续换一套服务器处理这个请求
其参数用来说明在那些情况下继续选择下一台上游服务器转发请求.
error 向上游发起连接 发送请求 读取响应时出错
timeout 发送请求或读取响应时出错
invalid_header 上游服务器发送的响应时不合法
http_500 上游响应500
http_502 上游响应502
http_503 上游响应503
http_504 上游响应504
http_404 上游响应404
off      关闭proxy_next_upstream功能 只要一出错就选择另外一台上游再次出发
Nginx反向代理模块中还提供很多配置,如设置连接的超时时间,临时文件如何存储,如何缓存上游服务器响应等功能.

可以通过阅读 ngx_http_proxy_module了解更多详细情况

#sudo vim /usr/local/nginx/conf/nginx.conf 

server {
  listen       80;
  server_name  localhost;
  location / {
    #保证代理机器能访问到 下面的机器并装有nginx  在主机号为100的机器上有响应网页
    proxy_pass http://192.168.1.100;
    root   html;
    index  index.html index.htm;
  }
}
sudo /usr/local/nginx/sbin/nginx -s reload

加一些判断条件获取到对方请求的主机防止别人代理到自己的主机上

负载均衡

负载均衡是由多台服务器以对称的方式组成一个服务器集合，每台服务器都具有等价的地位，都可以单独对外提供服务而无须其他服务器的辅助。通过某种负载分担技术，将外部发送来的请求按照事先设定分配算法分配到对称结构中的某一台服务器上，而接收到请求的服务器独立地回应客户的请求。
均衡负载能够平均分配客户请求到服务器列阵，籍此提供快速获取重要数据，解决大量并发访问服务问题。

upstream块

upstream name {...}
配置块 http
upstream块定义一个上游服务器的集群,便于反向代理中的proxy_pass使用

upstream mynet{
    server www.zjq1.com;
    server www.zjq2.com;
    server www.zjq3.com;
}
server {
    location /{
        proxy_pass http://mynet;
    }
}

server

server name [paramenters]
配置块upstream
server配置项指定了一台上游服务器的名字,可以是域名 IP地址端口 UNIX句柄
weight= number;设置向这台服务器转发的权重,默认为1
max_fails=number;该选项域fail_timeout配合使用
        指在fail_timeout时间段内如果转发上游失败超过number次就认为当前的fail_timeout时间内
        这台服务器不可用,max_fails默认为1 如果设置为0 表示不检查失败次数
fail_timeout=time; fail_timeout表示该时间内转发多少次失败后就认为上游不可用.默认10s
down    表示上游服务器永久下线,只能在ip_hash配置时才有效
backup  在ip_hash配置时无效.只有所有非备份机都失败,才向上游备份服务器转发请求.
upstream mynet{
    server www.zjq1.com weight=5;
    server www.zjq2.com:8081 max_fails=3 fail_timeout=300s;
    server www.zjq3.com down;
}

ip_hash

配置块 upstream
希望来自某一个用户的请求始终落在固定的一台服务器上进行处理.
根据客户端的IP散列计算出一个key,将key按照upstream集群中的上游服务器进行取模,求得的值对应的主机接收转发请求.
ip_hash不可以与weight同时使用
如果upstream配置中有一台服务器暂时不可用,不能直接删除该配置,而应该使用down标识.
upstream mynet{
    ip_hash;
    server www.zjq1.top;
    server www.zjq2.top;  
    server www.zjq3.top down;
}

例子,服务器负载均衡基本配置,nginx中可以进行负载均衡的相关设置:

upstream my.net{    #my.net是自定义的命名 在server结构中引用即可

  #代理服务器为 两台机器192.168.22.136 192.168.22.147做负载均衡操作 
  #两台机器上 可以跑apache负载功能更为强大的网页相关任务

  #max_fails 表示尝试出错最大次数 即可认为该服务器 在fail_timeout时间内不可用
  # server servername:port   servername可以写主机名 或者点分式IP
  server 192.168.22.136:80 max_fails=1 fail_timeout=300s;
  server 192.168.22.147:80 max_fails=1 fail_timeout=300s;  
}


server {
  listen       80;
  server_name  localhost; 
  location / {
    #upstream 块名
    proxy_pass http://my.net;
    root   html;
    index  index.html index.htm;
  }

动手开始配置起来才能慢慢上手nginx配置和使用。

PS：淘宝团队出品，高质量讲nginx的电子书
http://tengine.taobao.org/book/