测试目的

测试目的

(1)弄清楚HTTP Upstream 模块中Server指令的max_failsfail_timeout参 数的关系、它们对后端服务器健康情况的检查起到了什么作用、它们的取值对Http proxy模块中的其它指令是否有直接或间接的影响等……

(2)测试HTTP Proxy模块中proxy_next_upstream、proxy_connect_timeout、proxy_read_timeout、 proxy_send_timeout指令的作用、对Nginx性能的影响、对后端服务器响应的处理等……

测试方法

本文测试不会使用压力测试,所有的测试都是通过浏览器手动刷新来实现的。后端服务器使用简单的PHP程序来实现。

测试环境

Nginx负载均衡/反向代理服务器 系统:CentOS 5.4 64bit Nginx:0.7.65 IP:192.168.108.10

后端web服务器 系统:CentOS 5.4 64bit Web环境:apache+PHP Web-1 IP:192.168.108.163 Web-2 IP:192.168.108.164

本次测试主要针对HTTP Upstream和HTTP Proxy模块进行,下面测试环境中http upstream 和http proxy模块参数的初始化设置,后文会针对测试的参数进行相应的修改

  server 192.168.108.163 ; server 192.168.108.164:; server listen          ; server_name     .test.com; index           index.PHP index.html index.htm; location proxy_next_upstream error timeout invalid_header http_500 http_502 http_503 http_504 http_404; proxy_connect_timeout       10s; proxy_read_timeout          2s;        10s; proxy_pass http:;

提出server指令后面的参数部分,以下摘抄Nginx wiki 内容

语法:server name [parameters]

parameters包 含:

·weight = NUMBER - 设置服务器权重,默认为1。

·max_fails = NUMBER - 在一定时间内(这个时间在fail_timeout参数中设置)检查这个服务器是否可用时产生的最多失败请求数,默认为1,将其设置为0可以关闭检查,这 些错误在proxy_next_upstream或fastcgi_next_upstream(404错误不会使max_fails增加)中定义。

·fail_timeout = TIME - 在这个时间内产生了max_fails所设置大小的失败尝试连接请求后这个服务器可能不可用,同样它指定了服务器不可用的时间(在下一次尝试连接请求发起 之前),默认为10秒,fail_timeout与前端响应时间没有直接关系,不过可以使用proxy_connect_timeout和 proxy_read_timeout来控制。

·down - 标记服务器处于离线状态,通常和ip_hash一起使用。

·backup - (0.6.7或更高)只用于本服务器,如果所有的非备份服务器都宕机或繁忙。

关于max_fails 参数的理解根 据上面的解释,max_fails默认为1,fail_timeout默 认为10秒,也就是说,默认情况下后端服务器在10秒钟之内可以容许有一次的失 败,如果超过1次则视为该服务器有问题,将该服务器标记为不可用。等待10秒后再 将请求发给该服务器,以此类推进行后端服务器的健康检查。但如果我将max_fails设置为0, 则代表不对后端服务器进行健康检查,这样一来fail_timeout参数也就没什么意义了。那若后端服务器真的出现 问题怎么办呢?上文也说了,可以借助proxy_connect_timeout和proxy_read_timeout进 行控制。

下面介绍http proxy模块中的相关指令:

proxy_next_upstream 语法: proxy_next_upstream [error|timeout|invalid_header|http_500|http_502|http_503|http_504|http_404|off] 确定在何种情况下请求将转发到下一个服务器。转发请求只发生在没有数据传递到客户端的过程中。

proxy_connect_timeout 后端服务器连接的超时时间_发起握手等候响应超时时间

proxy_read_timeout 连接成功后_等候后端服务器响应时间_其实已经进入后端的排队之中等候处理(也可以说是后端服务器处理请求的时间)

proxy_send_timeout 后端服务器数据回传时间_就是在规定时间之内后端服务器必须传完所有的数据

proxy_pass 这个指令设置被代理服务器的地址和被映射的URI

开始测试

情况1:后端程序执行时间超过或等于proxy_read_timeout设 置值,max_fails=0 关闭后端服务器健康检查。

Nginx配置修改内容 error timeout proxy_read_timeout 2s PHPPHPPHP header('RS:Web1'); $t = 2; sleep($t); echo "sleep {$t}s
"; echo "web-1
"; ?>PHP header('RS:Web2'); $t = 5; sleep($t); echo "sleep {$t}s
"; echo "web-2
"; ?>备注:

我这里的两台后端web服务器,他们的主页文件均为一个test.PHP程序,该程序分别sleep了2秒和5秒,等于和超过了 proxy_read_timeout的时间,[max_fails=0] 即关闭后端服务器健康检查。[proxy_next_upstream error timeout] 说明碰到错误或超时的情况切到下一个后端服务器。如此设置后利用curl命令对Nginx发起连接请求,看Nginx会作何反应。

测试开始:

(1)curl -I -w %{time_total}:%{time_connect}:%{time_starttransfer} PHP">www.test.com/test.PHP Server: Nginx/0.7.65 Date: Tue,18 May 2010 02:43:08 GMT Content-Type: text/html; charset=utf-8 Content-Length: 183 Connection: keep-alive

说明:

连续请求3次后得到的http返回结果是一样的,均为504 Gateway Time-out 错误。这种情况只有在后端服务器都有问题的时才会出现这个错误,很显然我这里的proxy_read_timeout设置的时间太短,后端程序还没来得及 把程序执行完,Nginx就迫不及待的将请求甩给upstream定义的另一台服务器上了,当发现另外一台服务器同样2秒没有返回后,Nginx这回没有 服务器可用,只有返回504 Gateway Time-out 。这也是为什么最后的time_total时间是4秒。(经查看两台web服务器的访问日志得知,均有一条访问记录,且返回代码为200,说明Nginx 确实来过,但没有等到执行完成就匆匆的离去了)如果我有3台服务器,在保证任何不变的情况下,time_total时间一定会是6秒,因为Nginx会一 个接一个的将3台服务器都走一遍。

-----------------------------------------------------------------------------------------------------------------------

好了,确认是我proxy_read_timeout设置时间太短后,我将它的值设置为3秒,再通过curl命令访问:

(2)curl -I -w %{time_total}:%{time_connect}:%{time_starttransfer} www.test.com/test.PHP Server: Nginx/0.7.65 Date: Tue,18 May 2010 03:07:58 GMT Content-Type: text/html; charset=UTF-8 Connection: keep-alive Vary: Accept-Encoding X-Powered-By: PHP/5.1.6

说明:通过3次连续请求,得到的结果是一样的,RS:Web1 也就是说我这三次的请求都甩到了web1上。但我web1中的程序只需要2秒后就可以返回结果,但为什么我通过Nginx代理后时间总是我的 程序执行时间+proxy_read_timeout时间呢?

-----------------------------------------------------------------------------------------------------------------------

继续将proxy_read_timeout设置为4s

(3)curl -I -w %{time_total}:%{time_connect}:%{time_starttransfer} www.test.com/test.PHP Server: Nginx/0.7.65 Date: Tue,18 May 2010 03:15:25 GMT Content-Type: text/html; charset=UTF-8 Connection: keep-alive Vary: Accept-Encoding X-Powered-By: PHP/5.1.6

三次请求后结果也是一样,这次花的时间更长了,但确实是 时间。但为什么每次都需要6秒呢?按照upstream中定义的权重应该是平分请求的,最起码 应该有2秒的时候。经过分析得知:最终返回给用户请求的是web1,那么当再次请求的时候一定会分给web2,由于web2是sleep 5秒的,因此经过proxy_read_timeout的时间(4s)后会跳到web1,结果还是web1返回的请求,所花时间就是Nginx在web2 等待的时间+web1执行的时间,以此类推下一次Nginx自然的还会分给web2……。如果有更多的后端web,则判断下一个请求服务器可以看当前返回 给最终用户的是那台服务器,然后根据upstream中定义的顺序向下查询(权重一样的情况)

结论:

(1)上面的三次测试分别将proxy_read_timeout的值设置为2s、3s、4s的情况进行的。最终的测试结果也都在后面做了解释与说 明。由于我关闭了后端服务器的健康检查(max_fails=0)因此判断后端服务器情况的唯一依据便是proxy_read_timeout参数,如果 这个参数设置得过小,但后端程序的执行或多或少会超过这个时间的话,这种情况Nginx的效率是非常低的。

(2)上面的测试都是后端服务器正常但执行超时的情况下Nginx根据proxy_read_timeout和 proxy_next_upstream的值来选择下一个服务器,那如果我后端服务器直接报错的情况呢?可以想到如果报错信息在 proxy_next_upstream 中有定义的话Nginx还会跳到下一台服务器。否则直接将保存信息返回给Nginx从而最终呈献给用户

情况2:打开后端服务器健康检查,测试程序执行时间超过或等于proxy_read_timeout值或后端服务器直接报错的情况
Nginx配置修改内容; server 192.168.108.164 max_fails = ; proxy_next_upstream error timeout http_500 http_502 http_504 proxy_read_timeout 2s PHPPHPPHP header('RS:Web1'); $t = 2; sleep($t); echo "sleep {$t}s
"; echo "web-1
"; ?>PHP header('RS:Web2'); #$t = 5; #sleep($t); echo "sleep {$t}s
"; echo "web-2
"; ?>备注:

开启了后端服务器健康检查 proxy_read_timeout (下面会随着测试变更) Web1程序仍然sleep 2s 修改了Web2程序,让他直接返回500错误

测试开始:

(1)连续测试三次结果如下:

curl -I -w %{time_total}:%{time_connect}:%{time_starttransfer} www.test.com/test.PHP Server: Nginx/0.7.65 Date: Tue,18 May 2010 07:01:48 GMT Content-Type: text/html; charset=utf-8 Content-Length: 183 Connection: keep-alive

curl -I -w %{time_total}:%{time_connect}:%{time_starttransfer} www.test.com/test.PHP502 Bad Gateway Server: Nginx/0.7.65 Date: Tue,18 May 2010 07:01:50 GMT Content-Type: text/html; charset=utf-8 Content-Length: 173 Connection: keep-alive

curl -I -w %{time_total}:%{time_connect}:%{time_starttransfer} www.test.com/test.PHP Server: Nginx/0.7.65 Date: Tue,18 May 2010 07:01:57 GMT Content-Type: text/html; charset=utf-8 Content-Length: 183 Connection: keep-alive

说明:

第1次请求所用时间是2秒,web1执行超时,web2返回了500错误,upstream没有更多的后端,因此Nginx直接把504扔出来了, 同时标记web2,web1不可用。查看后端2台web服务器的访问日志,均有Nginx代理的访问记录。 第2次请求时间很短,报502错误,说明没有可用的后端服务器接受请求。查看后端两台web服务器访问日志,没有任何变化,说明这两台服务器被Nginx 标记为不可用,没有把请求转向后端,直接返回用户502错误 第3次请求同第1次

(2)修改 proxy_read_timeout 连续访问6次后结果以及2台web服务器的日志情况 curl -I -w %{time_total}:%{time_connect}:%{time_starttransfer} www.test.com/test.PHP Server: Nginx/0.7.65 Date: Tue,18 May 2010 07:30:15 GMT Content-Type: text/html; charset=UTF-8 Connection: keep-alive Vary: Accept-Encoding X-Powered-By: PHP/5.1.6

访问日志

[18/May/2010:15:30:00 [18/May/2010:15:30:03 [18/May/2010:15:30:05 [18/May/2010:15:30:08 [18/May/2010:15:30:11 [18/May/2010:15:30:13

[18/May/2010:15:30:00 [18/May/2010:15:30:11

说明:

由访问日志可知: 第1次请求是被分到web2上的,由于它返回了500错误,因此请求被转到web1,并标记web2不可用。 第2次至第4次均将请求给了web1,第四次请求完毕后距第一请求已经过去了8秒。 第5次请求时已经是fail_timeout参数默认的10s也就是标记web2不可用的时间已经过去了,因此在第5 次访问实际上和第一次情况是一样的。

结论:

(1proxy_next_upstream参数很有用,他可以避免很多 错误(2max_fails 参数在繁忙的大型系统中建议设置为3,如果没有几个后端服务器的话保持默认即可。(3proxy_read_timeout要根据自身程序而定,不要过大,也不 要太小。如果是PHP程序,请参照PHP.ini中的max_execution_time选项值。

相关文章

1、到apache官网上下载apache的安装文件 http://httpd.apache.org/download.cgi 点击链接Files for Mic...
1.确保apache已开启rewrite。 2.在.htaccess文件中添加如下: RewriteEngine On RewriteCond %{HTTP_RE...
在httpd.conf中修改ErrorLog和CustomLog的配置 ErrorLog "|E:/apache2.2/bin/rotatelogs.exe ...
1、打开apache的配置文件httpd.conf,打开如下项 LoadModule proxy_module modules/mod_proxy.so LoadM...
一、下载必须的安装源码包 http://httpd.apache.org/download.cgi#apache24 httpd-2.4.23.tar.gz http:...
1.在apache配置文件httpd.conf中找到如下行: #LoadModule rewrite_module modules/mod_rewrite.so 去掉...