[Linux 运维系列] Linux系统性能调优技巧

🕗 发布于 2024-12-12 01:51 linux

Linux 作为一款广泛应用的操作系统，在服务器、云计算、嵌入式等众多领域都占据着重要地位。无论是 CentOS、Debian、Ubuntu 还是红帽企业级 Linux，都可以通过一系列的优化手段来提升系统性能、安全性与稳定性。本文将深入探讨 Linux 系统优化的各个方面，为广大 Linux 用户提供全面的优化参考。

一、系统安装与初始化优化

（一）发行版选择与安装规划

在开始使用 Linux 系统之前，首先要根据实际需求选择合适的发行版。CentOS 以其稳定性著称，适合作为服务器操作系统，尤其是企业级应用，长期支持且软件包丰富且稳定。Debian 具有高度的可定制性与稳定性，其软件包管理系统简洁高效，适用于对系统自主性要求较高的用户。Ubuntu 则以易用性为特色，拥有庞大的社区支持，对于新手和桌面用户较为友好，同时在服务器领域也有不错的表现。红帽企业级 Linux 作为商业发行版，提供专业的技术支持和服务，适合大型企业关键业务系统。

此外，不同发行版对于特定硬件架构有着不同的适配性。例如，在 ARM 架构的嵌入式设备中，某些基于 ARM 优化的特定 Linux 发行版能够更好地发挥硬件性能，减少资源消耗并提高运行效率。在安装过程中，合理的磁盘分区规划至关重要。一般而言，根分区（/）应分配足够的空间以容纳操作系统和常用软件，但不宜过大，避免浪费磁盘资源。/home 分区用于存储用户数据，可根据用户数量和数据量预估大小。对于服务器，/var 分区通常需要较大空间，因为它用于存放日志文件、邮件队列等动态数据。例如，对于一台数据库服务器，/var 分区可能需要预留几十甚至上百 GB 的空间来存储数据库日志。同时，在安装时还可选择如 btrfs 等高级文件系统格式，btrfs 具有强大的快照功能，可方便数据备份与恢复，在某些对数据管理要求较高的场景下具有明显优势。

（二）软件包管理源优化

默认的软件包管理源可能位于国外，下载速度较慢。因此，更换为国内的镜像源可以显著提高软件包下载与更新的速度。以 CentOS 为例，可通过以下步骤更换阿里云镜像源：

# 备份原 yum 源配置文件
mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.backup
# 下载阿里云的 CentOS 镜像源配置文件
wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo
# 清理 yum 缓存并生成新的缓存
yum clean all
yum makecache

对于 Debian 和 Ubuntu，可以修改 /etc/apt/sources.list 文件，将源地址替换为国内的镜像站点，如阿里云、清华大学开源软件镜像站等，然后运行 apt-get update 命令更新软件包列表。

同时，应建立源的验证和更新机制。定期使用工具如 wget 或 curl 检查源的可用性，例如：

wget -q --spider http://mirrors.aliyun.com/repo/Centos-7.repo
if [ $? -eq 0 ]; then
    echo "源可用"
else
    echo "源不可用，考虑切换备用源"
fi

若主源出现问题，可快速切换到备用源，如在 CentOS 中提前备份多个不同镜像源的配置文件，在需要时直接替换当前的 yum 源配置文件并更新缓存。

二、系统内核参数优化

（一）网络参数优化

网络性能对于服务器和网络应用至关重要。通过调整内核网络参数，可以提高网络连接的并发处理能力和响应速度。例如，调整 net.ipv4.tcp_max_syn_backlog 参数可以增大半连接队列长度，容纳更多的并发连接请求：

# 在 /etc/sysctl.conf 文件中添加以下内容
net.ipv4.tcp_max_syn_backlog = 2048
# 使配置生效
sysctl -p

另外，缩短 net.ipv4.tcp_fin_timeout 参数的值可以加快连接关闭的速度，释放系统资源：

# 在 /etc/sysctl.conf 文件中添加
net.ipv4.tcp_fin_timeout = 30
# 生效配置
sysctl -p

在不同网络环境下，参数调整策略也有所不同。在高延迟网络中，可适当调整 TCP 重传超时参数 net.ipv4.tcp_retries2。例如，将其值调大，以减少不必要的重传，避免因网络延迟导致的误判：

# 在 /etc/sysctl.conf 文件中添加
net.ipv4.tcp_retries2 = 15
# 生效配置
sysctl -p

（二）内存管理参数优化

合理配置内存管理参数能够提升系统对内存的利用效率。其中，swappiness 参数控制内存交换的倾向程度。对于内存较大且希望减少不必要交换的服务器，可以将 swappiness 调小，例如设置为 10：

# 在 /etc/sysctl.conf 文件中添加
vm.swappiness = 10
# 生效配置
sysctl -p

这意味着系统将更倾向于使用物理内存，而不是频繁地将内存数据交换到磁盘上的交换空间，从而提高系统性能。在内存超配场景下，如虚拟化环境中，需要更加谨慎地调整内存管理参数。例如，可根据虚拟机的实际内存使用情况动态调整宿主机的 swappiness 参数，避免因过度超配导致系统性能急剧下降。同时，对于内存密集型应用，可适当增加内存分配给应用程序的比例，减少系统缓存占用；而对于 CPU 密集型应用，则可适当提高系统缓存，以提高数据读取速度。

三、文件系统优化

（一）文件系统选择与挂载参数

不同的文件系统具有不同的特性。ext4 是较为常用的文件系统，具有较好的兼容性和性能。而 xfs 文件系统在高并发和大容量存储场景下表现出色。在挂载文件系统时，可以设置一些参数来优化性能。例如，对于 xfs 文件系统，使用 noatime、nodiratime 参数可以减少文件访问时间的记录，从而提升文件系统的读写速度：

# 在 /etc/fstab 文件中添加挂载参数，如
/dev/sda1 /data xfs defaults,noatime,nodiratime 0 0
# 重新挂载文件系统或重启系统使参数生效
mount -o remount /data

ext4 在处理大量小文件时，可通过调整一些参数来提高性能，如设置 dir_index 选项启用目录索引功能，加快目录遍历速度：

# 在挂载时添加参数
mount -o remount,dir_index /dev/sda2 /home

xfs 在处理大文件读写时优势明显，但在数据完整性和容错性方面相对 ext4 有不同的表现。ext4 具有较好的日志记录功能，在系统突然断电等异常情况下能更好地保证数据完整性，而 xfs 则在大规模并发读写时具有更高的效率和扩展性。在多用户、多任务并发访问场景下，xfs 能够更好地处理高负载的文件操作请求，减少因锁竞争导致的性能下降。

（二）磁盘 I/O 调度算法调整

磁盘 I/O 调度算法影响着磁盘读写操作的顺序和效率。常见的调度算法有 cfq（完全公平队列）、deadline（限期调度）、noop（空操作）等。对于传统机械硬盘，cfq 算法能够提供较为公平的 I/O 分配，但对于固态硬盘（SSD），noop 算法可能更为合适，因为 SSD 不存在机械寻道时间，noop 算法可以减少额外的调度开销。

# 查看当前 I/O 调度算法
cat /sys/block/sda/queue/scheduler
# 设置为 noop 算法（临时生效，重启后恢复）
echo noop > /sys/block/sda/queue/scheduler
# 若要永久生效，可在 /etc/rc.local 文件中添加上述命令（需确保 rc.local 有执行权限）

不同类型磁盘阵列下的调度算法选择也有差异。在 RAID 0 阵列中，由于数据分布在多个磁盘上且无冗余，追求的是高读写速度，noop 算法通常能发挥较好性能；在 RAID 1 阵列中，注重数据的冗余备份，cfq 算法可保证读写操作的公平性和数据的一致性；对于 RAID 5 阵列，综合了数据冗余和读写性能，可根据实际应用场景在 cfq 和 deadline 算法之间进行选择，如在以读操作为主的场景下，deadline 算法可能更优，而在读写较为均衡的场景下，cfq 算法可提供稳定的性能表现。

四、服务性能优化

（一）Web 服务优化

以 Apache 和 Nginx 为例，这两款是广泛使用的 Web 服务器软件。

对于 Apache，调整 MaxClients 参数可以控制并发连接数，避免过多连接导致服务器过载：

# 在 Apache 配置文件 httpd.conf 中
# 设置 MaxClients，例如
MaxClients 256

优化 KeepAlive 配置可以减少连接建立的开销：

# 配置 KeepAlive
KeepAlive On
KeepAliveTimeout 5

在高并发长连接场景下，需要合理设置资源回收和连接复用机制。例如，可通过调整 MaxKeepAliveRequests 参数来限制每个持久连接允许的最大请求数，防止某个连接占用过多资源：

# 在 httpd.conf 中设置
MaxKeepAliveRequests 100

还可以启用缓存模块（如 mod_cache）来缓存静态资源，提高响应速度：

# 启用缓存模块相关配置（此处仅示例，实际配置更复杂）
LoadModule cache_module modules/mod_cache.so
<IfModule mod_cache.c>
    CacheEnable disk /static
    CacheRoot "/var/cache/apache2"
</IfModule>

对于 Nginx，优化 worker_processes 和 worker_connections 参数能够提升并发处理能力：

```bash
# 在 Nginx 配置文件 nginx.conf 中
# 设置 worker_processes 为 CPU 核心数
worker_processes auto;
# 设置 worker_connections
events {
    worker_connections  1024;
}

配置缓存区域（如 proxy_cache）用于缓存动态和静态资源：

# 配置缓存区域，例如
proxy_cache_path /data/nginx/cache levels=1:2 keys_zone=my_cache:10m max_size=10g inactive=60m use_temp_path=off;
server {
    # 针对特定 location 设置缓存
    location /static/ {
        proxy_cache my_cache;
        proxy_cache_key "$uri$is_args$args";
        proxy_cache_valid 200 60m;
        proxy_cache_bypass $http_pragma;
        proxy_cache_revalidate $http_cache_control;
        proxy_pass http://backend;
    }
}

在处理动态内容缓存时，Nginx 的缓存更新策略至关重要。可设置 proxy_cache_bypass 和 proxy_cache_revalidate 指令来灵活控制缓存的绕过和重新验证条件，确保用户获取到最新的动态内容，同时又能有效利用缓存减少后端服务器的压力。例如，当用户请求的参数中包含特定标识时，可绕过缓存直接从后端获取最新数据：

proxy_cache_bypass "$arg_no_cache";

（二）数据库服务优化（以 MySQL 为例）

在 MySQL 优化中，首先要对配置文件进行调整。innodb_buffer_pool_size 参数设置 InnoDB 缓冲池大小，一般建议设置为服务器内存的 70% - 80%，以提高数据库的读写性能：

# 在 MySQL 配置文件 my.cnf 中
[mysqld]
innodb_buffer_pool_size = 4G  # 根据服务器内存调整

query_cache_size 参数控制查询缓存大小，合理设置可以缓存查询结果，减少重复查询的开销：

query_cache_size = 64M

不同存储引擎在不同业务场景下的参数调整差异明显。MyISAM 引擎在以读操作较多的场景下，可适当调整 key_buffer_size 参数来提高索引缓存的性能：

# 在 my.cnf 中设置
key_buffer_size = 128M

而 InnoDB 引擎在写操作频繁的场景下，可优化 innodb_log_file_size 和 innodb_flush_log_at_trx_commit 参数来平衡事务提交的性能和数据安全性：

innodb_log_file_size = 256M
innodb_flush_log_at_trx_commit = 2

对于 MySQL 的主从复制和集群配置中的优化要点，在主从复制中，可通过设置 binlog_format 为 row 模式来减少主从数据不一致的风险，同时优化主从同步的延迟问题。例如，在主服务器上设置：

# 在 my.cnf 中设置
binlog_format = row

在集群配置中，可采用负载均衡器来均匀分配数据库连接请求到各个节点，如使用 HAProxy 或 MySQL Proxy 等工具，并根据节点的性能和负载情况动态调整权重分配。

（三）邮件服务优化（以 Postfix 为例）

在 Postfix 配置优化方面，调整邮件队列参数可以提高邮件处理效率。例如，设置 queue_directory 参数指定邮件队列目录，设置 message_size_limit 参数限制邮件大小：

# 在 Postfix 主配置文件 main.cf 中
queue_directory = /var/spool/postfix
message_size_limit = 10240000  # 10MB 邮件大小限制

在大规模邮件发送场景下，如企业邮件群发，可优化邮件队列管理。例如，设置 queue_run_delay 参数来调整队列处理的时间间隔，根据邮件服务器的负载情况合理分配资源：

queue_run_delay = 300s  # 每 5 分钟处理一次队列

为了保障邮件系统安全，防止垃圾邮件和病毒邮件的侵扰，需要集成反垃圾邮件与反病毒工具。如集成 SpamAssassin 进行垃圾邮件过滤，集成 ClamAV 进行病毒检测。安装并配置这些工具，使其与 Postfix 协同工作，对进出邮件进行过滤和检测，能够有效提升邮件系统的安全性与性能。由于其配置较为复杂，这里仅简要提及，实际操作需要深入学习相关工具的文档和指南。在与外部邮件服务提供商（如网易邮箱、腾讯邮箱等）的兼容性配置方面，需要正确设置域名解析的 MX 记录和 SPF 记录，确保邮件能够正常收发，并且避免被误判为垃圾邮件。例如，在域名管理控制台中添加 MX 记录指向邮件服务器的 IP 地址，并配置 SPF 记录允许合法的邮件服务器发送邮件：

MX 10 mail.example.com.
v=spf1 mx -all

五、系统安全与监控优化

（一）系统安全加固

用户与权限管理 合理创建用户与用户组，遵循最小权限原则。为不同的服务创建独立的用户，例如为 Web 服务创建 www 用户，为数据库服务创建 mysql 用户等，并且仅赋予这些用户执行相关任务所需的最小权限。定期清理无用用户，避免潜在的安全风险。可以使用 useradd 和 groupadd 命令创建用户和用户组，使用 chown 和 chmod 命令设置文件和目录的所有者与权限。同时，可采用特权分离机制，如使用 sudo 进行权限细化管理。例如，允许普通用户在特定命令下以 root 权限执行，通过编辑 /etc/sudoers 文件进行配置：

# 允许 user1 以 root 权限执行 /usr/sbin/apachectl 命令
user1 ALL=(root) /usr/sbin/apachectl

SSH 服务安全 修改 SSH 端口，避免使用默认的 22 端口，减少被扫描和攻击的可能性：

# 修改 SSH 配置文件 /etc/ssh/sshd_config
Port 2222  # 修改端口号

禁止 root 直接登录，降低安全风险：

PermitRootLogin no  # 禁止 root 登录

启用密钥认证替代密码认证，提高登录安全性。首先在客户端生成密钥对，然后将公钥上传到服务器的 authorized_keys 文件中：

# 启用密钥认证相关配置（需先生成密钥对并配置到服务器和客户端）
PubkeyAuthentication yes
AuthorizedKeysFile.ssh/authorized_keys

为防范 SSH 中间人攻击，可使用 SSHFP 记录进行服务器身份验证。在域名管理控制台中添加 SSHFP 记录，对应服务器的 SSH 公钥指纹信息，客户端在连接时可验证服务器身份的真实性。

防火墙配置 使用 iptables 或 firewalld（根据 Linux 发行版）配置防火墙规则，限制特定端口的访问。只允许合法的服务端口对外，禁止不必要的入站和出站连接。以 firewalld 为例（CentOS 7 及以上）：

# 开启防火墙服务
systemctl start firewalld
# 允许特定服务端口，如 HTTP 服务
firewall-cmd --add-service=http --permanent
# 重新加载防火墙规则
firewall-cmd --reload

根据网络拓扑（如内网、外网、DMZ 区等）进行分层防火墙策略的制定。例如，在内网与 DMZ 区之间设置严格的访问控制，只允许特定的应用协议通过，如允许从 DMZ 区到内网的数据库连接端口，但禁止其他不必要的端口访问；在 DMZ 区与外网之间，对外部访问进行严格过滤，只开放对外提供服务的端口，如 Web 服务端口等。

（二）系统监控与性能分析

系统性能监控工具 常用的系统监控工具如 top、htop、vmstat、iostat 等可以帮助我们实时查看系统的 CPU、内存、磁盘 I/O、网络等资源的使用情况。top 命令提供了系统资源的动态实时视图，htop 则是一个更为直观和交互式更强的工具。vmstat 可以统计系统的虚拟内存、进程、CPU 等信息，iostat 用于监控磁盘 I/O 性能。例如，使用 top 命令可以查看当前系统中各个进程的 CPU 和内存占用情况，及时发现占用资源过高的进程并进行排查。

可以使用脚本或自动化工具（如 Ansible 等）来定期采集和分析这些工具的输出数据，以便进行趋势分析。例如，编写一个简单的 Ansible 剧本，在多个目标主机上执行 top 命令并收集结果：

---
- name: Monitor system resources
  hosts: all
  tasks:
    - name: Run top command
      command: top -b -n 1 > /tmp/top_output.txt
    - name: Fetch top output
      fetch:
        src: /tmp/top_output.txt
        dest: /local/directory/top_results/{{ inventory_hostname }}.txt

这样就可以将多个主机的 top 命令结果收集到本地目录，方便后续进行统一分析和对比，从而更好地了解整个系统集群的性能状态和变化趋势。

日志分析与管理 配置系统日志服务（如 rsyslog），集中管理日志，定期分析日志文件，如查看系统错误日志、访问日志等，从中发现潜在的安全问题或性能异常。在 rsyslog 配置文件 /etc/rsyslog.conf 中，可以设置日志轮转相关参数，避免日志文件过大占用过多磁盘空间：

# 在 rsyslog 配置文件 /etc/rsyslog.conf 中
# 设置日志轮转相关参数
$WorkDirectory /var/lib/rsyslog
$ActionFileDefaultTemplate RSYSLOG_TraditionalFileFormat
$IncludeConfig /etc/rsyslog.d/*.conf
$OmitLocalLogging on
$IMJournalStateFile imjournal.state

同时，可以使用 logrotate 工具配置日志轮转规则，定期对日志文件进行压缩、备份和清理。此外，一些基于机器学习的日志分析工具（如 ELK Stack 中的 Logstash 结合机器学习插件）在异常检测方面有着出色的应用。通过对大量历史日志数据的学习，这些工具能够识别出与正常模式偏离较大的日志条目，例如异常的登录尝试、频繁的资源访问失败等，并及时发出警报。例如，Logstash 可以配置相关的机器学习管道，对系统登录日志进行分析，当检测到短时间内来自多个不同 IP 的大量登录失败记录时，触发警报通知管理员，以便及时采取措施防范潜在的安全威胁。

自动化监控与报警 使用 Nagios、Zabbix 等监控软件搭建监控系统，对系统关键指标进行持续监控，当指标超出阈值时自动发送报警通知，以便及时处理系统故障或性能问题。以 Zabbix 为例，首先需要安装 Zabbix 服务器端和客户端，然后在服务器端配置监控项、触发器和报警动作。例如，可以设置 CPU 使用率超过 80% 持续 5 分钟时触发报警，通过邮件、短信等方式通知管理员。
在多监控节点的分布式环境下，需要进行监控数据的汇总和统一报警管理。Zabbix 可以通过分布式监控架构实现这一点，在各个子节点上安装 Zabbix 代理（Zabbix Agent），将监控数据汇总到中心服务器。同时，为了避免误报和漏报，需要合理设置阈值和报警规则。例如，对于网络流量监控，可以结合历史流量数据和当前业务需求，设置动态阈值，避免因正常业务高峰导致的误报警；对于一些关键服务的监控，可以采用多指标关联报警，如当 Web 服务的 CPU 使用率高且同时连接数异常增加时才触发报警，提高报警的准确性和可靠性。详细的配置过程需要深入学习 Zabbix 的文档和教程，但一旦搭建成功，将为系统的稳定运行提供有力保障。

综上所述，Linux 系统的优化是一个综合性的工作，涵盖了从系统安装初始化到服务性能提升，再到系统安全与监控的多个方面。通过对这些方面的细致优化，可以使 Linux 系统在不同的应用场景下发挥出更好的性能，提供更稳定、安全的服务。无论是系统管理员还是普通 Linux 用户，掌握这些优化知识都有助于提升工作效率和系统体验。在实际操作中，需要根据系统的具体需求和硬件配置灵活运用这些优化策略，并且不断关注 Linux 技术的发展动态，以便及时调整优化方案。

原文地址：https://blog.csdn.net/shlei5580/article/details/144375411

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：网上商城设计+ssm
下一篇：Java Web 的基本概念

.NET(C#) 如何配置用户首选项及保存用户设置
.NET(C#) 如何配置用户首选项及保存用户设置
阅读更多2024-12-14
【最新】北大数字普惠金融指数数据集-省市县（2011-2023年）
郭峰,王靖一,王芳,孔涛,张勋,程志云.测度中国数字普惠金融发展:指数编制与空间特征[J].经济学(季刊),2020,19(04):1401-1418.时间跨度：省级和城市级指数时间跨度为2011-2
阅读更多2024-12-14
GESP202412 四级【Recamán】题解（AC）
a11ak−1−kkakak−1−kak−1k小杨想知道 Recamán 数列的前n项从小到大排序后的结果。手动计算非常困难，小杨希望你能帮他解决这个问题。
阅读更多2024-12-14
IDEA遇到EasyConnect中的网络资源无法访问的问题
版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。原文链接：https://blog.csdn.net/wanshanyu_/article/de
阅读更多2024-12-14
双目摄像头标定方法
此时已经完成标定，左下角为反投影误差，右边为外参可视化。将双目左右目拍的图像上传（左右目最好不少于20张）此时回到主页面，即可看到成功导出。把这些误差大的删除即可。
阅读更多2024-12-14
Servlet、omcat服务器架构与工作原理
Servlet是运行在服务器端的Java程序，它的主要职责之一是接收并处理来自客户端（如浏览器）的HTTP请求。当客户端发送一个请求到服务器时，Servlet可以解析请求中的信息，例如请求的URL路径
阅读更多2024-12-14
Vue生命周期钩子函数：深入解析与实践
作为高级Vue前端开发人员，对Vue组件的生命周期钩子函数有着深刻的理解是至关重要的。生命周期钩子函数是指在Vue组件的创建、更新、销毁等过程中，Vue自动调用的一系列方法。通过这些钩子函数，我们可以
阅读更多2024-12-14
安卓开发--使用android studio发布APP
app发布
阅读更多2024-12-14
数据结构与算法学习笔记----拓扑排序
@ author: 明月清了个风。
阅读更多2024-12-14
python 将数据保存到现有的Excel文件的新工作表
out_file = ‘query.xlsx’df1 = pd.DataFrame(out_data)若直接写入：df1.to_excel(out_file, index=False, sheet_n
阅读更多2024-12-14