Nginx常见错误码解析：403/404/502/503原因与解决

作为高性能的Web服务器和反向代理服务器，Nginx在日常运维中扮演着重要角色。然而，无论是新手还是经验丰富的运维人员，都难免会遇到各种HTTP错误码。本文将深入解析Nginx中最常见的四个错误码：403、404、502、503，帮助您快速定位问题并找到解决方案。

一、403 Forbidden（禁止访问）

错误含义

403错误表示服务器理解客户端的请求，但拒绝执行该请求。通俗来说，就是Nginx没有权限访问您请求的文件或目录。

常见原因

文件/目录权限问题：Nginx工作用户（通常为www-data）对网站目录没有读取权限
目录索引未开启：请求的是目录但没有默认索引文件（如index.html），且未开启autoindex
SELinux安全限制：在CentOS等系统中，SELinux可能阻止Nginx访问特定目录
访问控制规则：配置了deny all或IP限制规则
根目录配置错误：server块中的root路径配置不正确

解决方案

# 1. 设置正确的文件权限
sudo chown -R www-data:www-data /path/to/website
sudo find /path/to/website -type d -exec chmod 755 {} \;
sudo find /path/to/website -type f -exec chmod 644 {} \;

# 2. 开启目录索引（如果需要）
location /some-directory/ {
    autoindex on;
}

# 3. 临时关闭SELinux（测试用）
setenforce 0

# 4. 永久关闭SELinux
# 编辑/etc/selinux/config，设置SELINUX=disabled

# 5. 检查访问控制规则
# 确保location块中没有不合理的deny规则

排查步骤

查看Nginx错误日志：tail -f /var/log/nginx/error.log
确认请求的文件/路径确实存在
检查相关权限设置
确认SELinux状态：getenforce

二、404 Not Found（未找到）

错误含义

404是最常见的HTTP错误码，表示服务器找不到请求的资源。

常见原因

root/alias配置错误：路径拼接不符合预期
请求的文件不存在：文件已被删除或移动
单页应用路由问题：刷新页面时出现404，未配置try_files
proxy_pass配置错误：转发地址不存在
URL拼写错误：请求的URL中有误

解决方案

# 1. 检查root配置
server {
    listen 80;
    server_name example.com;
    root /var/www/html;  # 确保路径正确
    index index.html index.htm;
}

# 2. 单页应用配置
location / {
    try_files $uri $uri/ /index.html;
}

# 3. 检查proxy_pass配置
location /api/ {
    proxy_pass http://backend-server:8080/;  # 确保后端服务可访问
    proxy_set_header Host $host;
}

# 4. 配置正确的location匹配
location ~ \.php$ {
    fastcgi_pass unix:/run/php/php7.4-fpm.sock;
    include fastcgi_params;
}

排查步骤

核对请求URL是否正确
检查Nginx配置中的server_name、root指令
确认文件路径与请求路径一致
检查proxy_pass转发地址是否可正常访问

三、502 Bad Gateway（错误网关）

错误含义

502错误表示Nginx作为网关或代理时，从上游服务器收到无效响应。简单来说，就是后端服务挂了或者返回了Nginx无法理解的数据。

常见原因

后端服务未启动/已宕机：PHP-FPM、Tomcat等服务没有运行
端口配置错误：后端服务监听端口与Nginx配置不一致
PHP-FPM等服务问题：进程池耗尽、配置错误
防火墙拦截：后端服务端口被防火墙阻止
资源限制：打开文件数限制、内存不足等

解决方案

# 1. 检查后端服务状态
systemctl status php-fpm
systemctl status tomcat

# 2. 检查端口监听
ss -tlnp | grep :9000  # PHP-FPM默认端口
ss -tlnp | grep :8080  # Tomcat默认端口

# 3. 重启后端服务
systemctl restart php-fpm
systemctl restart tomcat

# 4. 检查防火墙
firewall-cmd --list-ports
ufw status

# 5. 调整系统限制
# 编辑/etc/security/limits.conf
www-data soft nofile 65535
www-data hard nofile 65535

错误日志分析

查看Nginx错误日志中的关键信息：

tail -f /var/log/nginx/error.log

# 常见错误信息及含义：
# connect() failed (111: Connection refused) - 后端服务没启动
# connect() failed (113: No route to host) - 网络不通
# upstream prematurely closed connection - 后端主动断开连接
# recv() failed (104: Connection reset by peer) - 后端处理异常
# no live upstreams - 所有upstream都挂了

PHP-FPM专项排查

# 查看PHP-FPM进程数
ps aux | grep "php-fpm" | grep -v grep | wc -l

# 查看PHP-FPM状态页（需先配置）
curl http://127.0.0.1/php-fpm-status

# 检查PHP-FPM日志
tail -100 /var/log/php-fpm/www-error.log

# 查看慢日志
tail -100 /var/log/php-fpm/www-slow.log

四、503 Service Unavailable（服务不可用）

错误含义

503错误表示服务器暂时无法处理请求，通常由于维护或过载。

常见原因

服务器过载：CPU、内存资源耗尽
主动维护：服务器正在进行维护操作
后端服务崩溃：应用服务异常终止
限流熔断：达到流量限制阈值
数据库连接池耗尽：数据库连接数达到上限

解决方案

# 1. 监控服务器资源
top -c
htop
free -h

# 2. 检查应用日志
tail -f /var/log/application/error.log

# 3. 检查数据库连接
# MySQL
mysqladmin processlist
# PostgreSQL
SELECT * FROM pg_stat_activity;

# 4. 实施限流策略
# Nginx限流配置
http {
    limit_req_zone $binary_remote_addr zone=limit_req:10m rate=10r/s;
}

server {
    location /api/ {
        limit_req zone=limit_req burst=20 nodelay;
        proxy_pass http://backend;
    }
}

# 5. 扩容服务器资源
# 增加服务器实例
# 升级服务器配置

高可用架构建议

负载均衡：使用多台服务器分担流量
自动扩缩容：根据监控指标自动调整服务器数量
服务降级：非核心功能降级，保证核心业务可用
缓存策略：合理使用Redis等缓存减少后端压力
异步处理：耗时操作改为异步执行

五、综合排查工具与技巧

1. Nginx配置检查

# 测试配置文件语法
nginx -t

# 重新加载配置（不中断服务）
nginx -s reload

# 查看编译参数
nginx -V

2. 日志分析命令

# 实时查看错误日志
tail -f /var/log/nginx/error.log

# 查看访问日志
tail -f /var/log/nginx/access.log

# 按时间筛选日志
grep "2025-12-01" /var/log/nginx/access.log

# 统计错误码出现次数
awk '{print $9}' /var/log/nginx/access.log | sort | uniq -c | sort -rn

3. 网络诊断工具

# 测试端口连通性
telnet backend-server 8080
nc -zv backend-server 8080

# 跟踪网络路由
traceroute backend-server
mtr backend-server

# 抓包分析
tcpdump -i eth0 port 80 -w nginx.pcap

4. 性能监控命令

# 查看系统负载
uptime
w

# 监控实时进程
top -c
htop

# 查看磁盘空间
df -h
du -sh /var/log/nginx/

# 检查内存使用
free -m
vmstat 1 10

六、预防措施与最佳实践

1. 配置管理

使用版本控制系统管理Nginx配置
配置变更前进行备份
实施配置审核流程

2. 监控告警

设置错误码监控告警
监控服务器资源使用率
实施日志集中管理

3. 容量规划

定期进行压力测试
根据业务增长规划资源
建立弹性伸缩机制

4. 安全加固

# 隐藏Nginx版本号
server_tokens off;

# 限制请求大小
client_max_body_size 10m;
client_header_buffer_size 16k;
large_client_header_buffers 4 64k;

# 设置超时时间
proxy_connect_timeout 60s;
proxy_read_timeout 60s;
proxy_send_timeout 60s;

总结

Nginx错误码是诊断服务器问题的重要工具。通过理解403、404、502、503等常见错误码的含义和掌握排查方法，我们可以快速定位和解决各种网站访问问题。关键是要建立系统化的排查思路：

403错误：重点检查权限和访问控制
404错误：关注路径配置和文件存在性
502错误：排查后端服务状态和连接问题
503错误：分析服务器负载和资源限制

记住，遇到问题时不要慌张，按照日志分析→原因定位→解决方案的步骤，大多数Nginx错误都能得到有效解决。同时，建立完善的监控体系和预防措施，可以有效减少错误的发生，保障业务的稳定运行。

一、403 Forbidden（禁止访问）

错误含义

常见原因

解决方案

排查步骤

二、404 Not Found（未找到）

错误含义

常见原因

解决方案

排查步骤

三、502 Bad Gateway（错误网关）

错误含义

常见原因

解决方案

错误日志分析

PHP-FPM专项排查

四、503 Service Unavailable（服务不可用）

错误含义

常见原因

解决方案

高可用架构建议

五、综合排查工具与技巧

1. Nginx配置检查

2. 日志分析命令

3. 网络诊断工具

4. 性能监控命令

六、预防措施与最佳实践

1. 配置管理

2. 监控告警

3. 容量规划

4. 安全加固

总结

相关文章