最近遇到了Nginx瘋狂拋錯,access.log一天一共5W多條,但error.log中有大概9K多條,基本都是111: Connection refused,這到底是為什么呢?
從日志看起
我們還是先來看日志。我提取了一條error.log當中拋錯的日志(稍微分一下行,否則實在太長,敏感信息稍微處理了一下):
2019/06/06 10:09:45 [error] 28652#0: *883239 connect() failed (111: Connection refused) while connecting to upstream, client: 124.104.90.145, server: xxx.xxxxx.com, request: "POST /test-service/upload?mcachenum=155978698 HTTP/1.1", upstream: "http://[::1]:17000/test-service/upload?mcachenum=155978698", host: "xxx.xxxxx.com", referrer: "https://servicewechat.com/x98b46f69/2/page-frame.html"
看了一下前面的報錯和后面的描述,第一眼看上去感覺都是正常。但再看之后發現,upstream中的host有些不一樣。[::1],這實際是一個IPv6的地址。
這時候你可以查看一下你的機器是否開啟了IPv6的地址,linux的命令是:ip address,看看返回結果中是否出現了inet6,如果有,那么恭喜你,原因找到了。
解決辦法
解決方法有兩種,一個是禁用你機器的IPv6配置,另一個則是修改nginx.conf中的配置。
個人覺得后一個方法更加保險一些,因為這不涉及到你的機器配置,應該相對而言最少。
nginx.conf的修改,則是針對server模塊中的location,修改proxy_pass中的host,我們在網上經常看到別人用的是:
proxy_pass http://localhost:18000/test-service/;
但為了強制指定IPv4的地址,需要變成:
proxy_pass http://127.0.0.1:18000/test-service/;
這樣操作之后,再觀察nginx的error.log,應該就不會再報upstream里含有IPv6地址的錯誤了。