Nginx的健康检查机制

createh54周前 (05-26)技术教程10

Nginx 健康检查机制,涵盖被动检测、主动检测、慢启动等核心功能,并结合配置示例说明其实现原理和应用场景。


一、被动健康检查(Passive Health Checks)

原理
通过监控客户端请求的 实际响应结果 自动屏蔽故障节点。当请求失败达到阈值时,Nginx 暂时将故障服务器移出负载均衡池,避免后续请求继续发送到该节点。

核心参数

  • max_fails: 在 fail_timeout 时间窗口内允许的最大失败次数(默认 1)。
  • fail_timeout: 包含两个含义: 统计失败次数的窗口时间(如 30s 内)。 服务器被屏蔽的持续时间(默认 10s)。

配置示例

upstream backend {
    server backend1.example.com max_fails=3 fail_timeout=30s;
    server backend2.example.com;
}
  • 行为:若 backend1 在 30 秒内连续失败 3 次,Nginx 将其标记为不可用并暂停转发请求 30 秒。
  • 注意:单服务器组中参数无效(无备用节点可切换)。

二、主动健康检查(Active Health Checks)(NGINX Plus 专属)

原理
定期向服务器发送 独立探活请求,主动检测节点健康状态。支持自定义检测条件(如状态码、响应头、响应体)。

基础配置

http {
    upstream backend {
        zone backend 64k;  # 共享内存区,用于多进程同步状态
        server backend1.example.com;
        server backend2.example.com;
    }

    server {
        location / {
            proxy_pass http://backend;
            health_check;  # 默认每5秒检测一次根路径"/"
        }
    }
}
  • 默认规则:每 5 秒发送 GET / 请求,响应状态码为 200-399 则标记为健康。

高级参数

health_check interval=10s fails=3 passes=2 port=8080 uri=/health;
  • interval: 检测间隔时间(默认 5s)。
  • fails: 标记节点故障需连续失败次数(默认 1)。
  • passes: 节点恢复需连续成功次数(默认 1)。
  • port: 指定检测端口(如 8080)。
  • uri: 自定义探活路径(如 /health)。

三、慢启动(Slow Start)(NGINX Plus 专属)

应用场景
防止故障恢复的服务器被瞬间流量压垮。通过逐步增加权重,让服务器在恢复后缓慢承接流量。

配置示例

upstream backend {
    server backend1.example.com slow_start=30s;  # 30秒内权重从0恢复至正常值
    server backend2.example.com;
}
  • 行为:backend1 恢复后,30 秒内从零开始逐步增加流量负载。

四、自定义健康条件(Custom Conditions)(NGINX Plus 专属)

通过 match 块定义复杂的健康判定规则,支持状态码、响应头、响应体匹配。

示例:检测特定响应内容

http {
    match server_ok {
        status 200-399;              # 状态码在200-399范围内
        header Content-Type =~ "json";  # 响应头包含"json"
        body !~ "error";             # 响应体不包含"error"
    }

    server {
        location / {
            proxy_pass http://backend;
            health_check match=server_ok;  # 应用自定义规则
        }
    }
}

五、强制健康检查(Mandatory Checks)(NGINX Plus 专属)

应用场景
新加入的服务器(如通过 API 或 DNS 动态添加)必须通过健康检查后才能接收流量。

配置示例

upstream backend {
    zone backend 64k;
    server backend1.example.com slow_start=30s;
}

server {
    location / {
        proxy_pass http://backend;
        health_check mandatory persistent;  # 强制检测 + 持久化状态
    }
}
  • mandatory: 新服务器必须通过检测才能加入负载均衡。
  • persistent: 配置重载时保留服务器状态(如之前已健康则跳过检测)。

六、协议扩展支持

Nginx Plus 支持对以下协议的健康检查:

  • HTTP/HTTPS
  • TCP/UDP
  • FastCGI、memcached、SCGI、uwsgi

七、最佳实践与注意事项

  1. 共享内存区 (zone)
    必须为 upstream 块定义共享内存,确保多进程间状态同步。
  2. upstream backend {
    zone backend 64k; # 64KB共享内存
    server backend1.example.com;
    }
  3. 连接复用优化
    对 TLS 上游启用连接复用,减少握手开销:
  4. location / {
    proxy_http_version 1.1;
    proxy_set_header Connection "";
    proxy_pass https://backend;
    health_check keepalive_time=60s; # 连接保持60秒
    }
  5. 被动检查与主动检查结合
  6. 被动检查适用于实时流量监控。
  7. 主动检查用于低频但精准的探活。

八、开源版 vs Plus 版功能对比

功能

NGINX 开源版

NGINX Plus

被动健康检查

主动健康检查

慢启动

自定义健康条件(match)

强制健康检查


通过合理配置健康检查机制,可显著提升服务可用性和容错能力,尤其在高并发或分布式系统中至关重要。

参考:

https://docs.nginx.com/nginx/admin-guide/load-balancer/http-health-check/

相关文章

网站打开慢?这15个细节决定了你的 Core Web Vitals 分数

说实话,现在做SEO,已经不是“内容+外链”就能稳赢的时代了。Google 在 Core Web Vitals(核心网页指标)上线之后,用户体验这件事,直接被摆到了第一线。你内容再好,页面加载慢、跳动...

职场必看!性能测试响应很慢怎么排查?

大多数的性能测试工作人员分为以下三个阶段:1、出了问题看资源,资源占用如果很高,报以窃喜的心态,恩,发现了,原理是资源瓶颈。2、资源没有出现瓶颈,通过一些技术手段分析,发现是组件的配置文件有问题,例如...

网站加载慢?让你的网站腾飞起来,LiteSpeed部署

说起LiteSpeed 还得说起我的小站,<开心洋葱网>,虽然流量不大,但是访问是真的慢,无奈经费有限,那就只能在服务器加速上动起心思来。之前一直听说 QUIC 访问网站的速度会让你感觉飞...

Nginx读书笔记-搭建高可用集群

NGINX作为反向代理服务器可以实现负载均衡,同时也可以作为静态文件服务器,它的特点就是并发支持大,单机可同时支持3万并发,现在很多网站都把NGINX作为网关入口来统一调度分配后端资源。但是如果NGI...

Nginx从入门到放弃05-访问日志与日志切割

设置访问日志当我们访问nginx服务时,nginx会记录日志,nginx日志分两种,一种是访问日志,一种是错误日志,访问日志记录在”access.log”文件中,错误日志记录在”error.log”文...

Nginx负载均衡的原理及处理流程

系统的扩展可以分为纵向扩展和横向扩展。纵向扩展是从单机的角度出发,通过增加系统的硬件处理能力来提升服务器的处理能力横向扩展是通过添加机器来满足大型网站服务的处理能力。这里面涉及到两个重要的角色分别是&...