Linux 下的 AWK 命令详细指南与示例

🕗 发布于 2024-11-22 06:49 linux 服务器 运维

简介

AWK 是 Linux 中功能强大的文本处理工具，用于模式扫描和处理。AWK 以其创建者（Aho、Weinberger 和 Kernighan）的名字命名，特别适合处理如日志、CSV 文件或配置文件等结构化文本数据。本指南全面讲解了 AWK 的功能，并通过实际示例展示其强大之处。

AWK 的主要特性

模式匹配：处理文件中符合特定模式的行。
字段操作：轻松访问和操作结构化文本中的特定字段。
算术运算：在命令中直接执行计算。
内置函数：支持字符串处理、数学运算等多种功能。
可移植性：适用于大多数类 Unix 系统。

基本语法

awk 'pattern {action}' filename

pattern：决定是否对某行执行动作的条件。
action：指定对匹配行执行的代码块。
filename：要处理的输入文件。

示例

1. 打印文件的所有行

awk '{print}' file.txt

此命令打印 file.txt 的所有行。{print} 操作适用于每一行。

2. 打印特定字段

AWK 使用 $1、$2 等表示一行中的字段。

awk '{print $1, $3}' file.txt

打印 file.txt 每行的第一和第三字段。

3. 打印匹配模式的行

awk '/pattern/' file.txt

打印包含“pattern”的行。

4. 基于条件过滤并打印

awk '$3 > 50 {print $1, $3}' file.txt

打印第三字段大于 50 的行的第一和第三字段。

5. 使用内置变量

NR：当前记录（行）的编号。
NF：当前记录中的字段数量。

awk '{print NR, NF, $0}' file.txt

打印行号、字段数和整行内容。

6. 执行算术运算

awk '{sum += $3} END {print "Total:", sum}' file.txt

计算并打印所有行的第三字段的总和。

7. 字符串操作

awk '{print toupper($1)}' file.txt

将每行的第一个字段转换为大写。

8. 使用 BEGIN 和 END 块

awk 'BEGIN {print "Start Processing"} {print $0} END {print "End Processing"}' file.txt

BEGIN 块在处理任何行之前执行。
END 块在处理完所有行后执行。

9. 处理分隔符文件

默认情况下，AWK 使用空格分割字段。可以使用 -F 指定自定义分隔符。

awk -F ',' '{print $1, $3}' file.csv

处理 CSV 文件并打印第一和第三字段。

高级功能

自定义脚本

将 AWK 脚本保存到文件中以便重复使用：

script.awk：

BEGIN {print "NameScore"}
$3 > 60 {print $1, $3}
END {print "Processing Complete"}

运行脚本：

awk -f script.awk file.txt

使用外部变量

通过 -v 标志将变量传递给 AWK：

awk -v threshold=50 '$3 > threshold {print $1, $3}' file.txt

总结

AWK 是一个功能强大的文本处理工具，对于在 Linux 上处理数据的人来说至关重要。其简单性与强大功能的结合，使其在从简单的文本提取到复杂的数据转换的任务中都表现出色。

原文地址：https://blog.csdn.net/qq_32019341/article/details/143953587

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：算法【子数组最大累加和问题与扩展】
下一篇：单例模式与QT中的C++实现

自动化测试基础知识总结
自动化测试是软件测试活动中一个重要分支和组成部分，随着软件行业发展，市场对软件周期及软件质量要求越来越高，催生出来各种开发模式，比如常见开发模式敏捷开发，同时对我们测试人员提更高的要求，此时，产生自动
阅读更多2024-11-22
buuoj WEB做题笔记
buuctf靶场web类做题笔记
阅读更多2024-11-22
Python蓄水池算法详解与应用案例
蓄水池算法（Reservoir Sampling）是一种用于处理大规模数据流的随机抽样算法。该算法能够在不知道数据流大小的情况下，从数据流中均匀随机地抽取固定大小的样本。每个元素被选中的概率相等，保证
阅读更多2024-11-22
自然语言处理:第六十二章 KAG 超越GraphRAG的图谱框架
一个对大型语言模型（LLMs）友好的知识表示框架。SPG属性被划分为知识和信息领域，也称为静态和动态领域，它们分别与具有强模式约束的决策专长和具有开放信息表示的文档检索索引知识兼容。归功于在构建更有效
阅读更多2024-11-22
闲聊？泳池清洁机器人？
本章就来聊聊泳池清洁机器人行业。"博主本身就身在这个行业~~"，这个行业的前景还是不错的(为什么这么说？)。据统计，目前全球有3692万个泳池，每年呈持续增长态势。预计到2026年
阅读更多2024-11-22
vue学习11.21
v-model:value,也可以写为v-model，默认收集value值。如果写成data:()=>,就变成全局windows的对象了，原型上有的东西，模板上可以直接用，可以直接{{ }}输出
阅读更多2024-11-22
Python数据分析NumPy和pandas（四十、Python 中的建模库statsmodels 和 scikit-learn）
作为建模过程的一部分，可以在一个数据集上拟合模型，然后基于另一个数据集(可能是之前数据集的一部分作为测试集，也可能是后面操作后得到的数据集)评估模型。非数值数据可以通过多种不同的方式转换为模型设计矩阵
阅读更多2024-11-22
深入探索JMeter bin目录中的Properties文件：优化性能测试的关键
是JMeter中的一种机制，用于存储和管理配置信息和参数设置。Properties文件是一种键值对的集合，可以在整个测试计划中共享和使用。它们通常以“.properties”为扩展名，并使用简单的文本
阅读更多2024-11-22
Jmeter中的断言（二）
假设我们需要测试一个Web应用，并验证两个请求的响应数据是否相同。假设我们有一个简单的测试计划，包含一个线程组和一个HTTP请求，并希望验证登录请求的 HTML 响应数据中。假设我们有一个简单的测试计
阅读更多2024-11-22
【实战】使用YOLO11进行驾驶疲劳检测及警报【附源码与详细说明】
【实战】使用YOLO11进行驾驶疲劳检测及警报【附源码与详细说明】
阅读更多2024-11-22