大数据中经常用到的linux awk的基本使用 - 代码天地

大数据中经常用到的linux awk的基本使用

其他 2018-10-25 13:01:21 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/baidu_20183817/article/details/81076867

awk的工作原理

awk 'BEGIN{ commands } pattern{ commands } END{ commands }'

第一步：执行BEGIN{ commands }语句块中的语句；
第二步：从文件或标准输入(stdin)读取一行，然后执行pattern{ commands }语句块，它逐行扫描文件，从第一行到最后一行重复这个过程，直到文件全部被读取完毕。
第三步：当读至输入流末尾时，执行END{ commands }语句块。

BEGIN语句块在awk开始从输入流中读取行之前被执行，这是一个可选的语句块，比如变量初始化、打印输出表格的表头等语句通常可以写在BEGIN语句块中。

END语句块在awk从输入流中读取完所有的行之后即被执行，比如打印所有行的分析结果这类信息汇总都是在END语句块中完成，它也是一个可选语句块。

pattern语句块中的通用命令是最重要的部分，它也是可选的。如果没有提供pattern语句块，则默认执行{ print }，即打印每一个读取到的行，awk读取的每一行都会执行该语句块。

示例

[root@web2 ~]$ echo -e "A line 1nA line 2" | awk 'BEGIN{ print "Start" } { print } END{ print "End" }'
Start
A line 1nA line 2
End
[root@web2 ~]$ echo -e "A line 1\nA line 2" | awk 'BEGIN{ print "Start" } { print } END{ print "End" }'
Start
A line 1
A line 2
End

当使用不带参数的print时，它就打印当前行，当print的参数是以逗号进行分隔时，打印时则以空格作为定界符。在awk的print语句块中双引号是被当作拼接符使用，例如：

[fsdf@wdfg ~]$ echo | awk '{ var1="v1"; var2="v2"; var3="v3"; print var1,var2,var3; }' 
v1 v2 v3

双引号拼接使用：

[gdf ~]$ echo | awk '{ var1="v1"; var2="v2"; var3="v3"; print var1"="var2"="var3; }'
v1=v2=v3

{ }类似一个循环体，会对文件中的每一行进行迭代，通常变量初始化语句（如：i=0）以及打印文件头部的语句放入BEGIN语句块中，将打印的结果等语句放在END语句块中。

猜你喜欢

转载自blog.csdn.net/baidu_20183817/article/details/81076867

大数据中经常用到的linux awk的基本使用

真实工作中经常用到的Aware使用简介

Linux基础-工作中经常使用到的linux 命令

redhat (Linux) 日常运维中经常使用到的指令

使用Linux时经常用到的指令

oracle 日常运维中经常使用到的指令

Javascript中经常用到的

工作中经常用到的Linux命令整理

Linux经常使用到的操作

Linux awk命令的基本用法

Android开发中经常用到的工具

开发中经常用到的特效效果

Python中经常用到的命令总结

linux awk的使用

linux awk 简单使用

linux awk命令使用

linux 里awk的使用

Linux------awk使用

linux awk使用详解

Linux之awk使用

linux awk命令的使用

Linux三剑客——grep、awk、sed命令基本使用教程

awk 的基本使用举例

awk 基本使用

awk的基本使用

Java开发中经常使用到的几种WebService技术实现方案

Eclipse开发调试过程中经常使用到的常见按钮

LINUX常用命令~java开发工作中经常用到的哟（持续更新）

awk的基本结构及常用内置参数演示

大数据-消息队列-Kafka(八)：Kafka-Eagle监控【监控Kafka集群的整体运行情况，在生产环境中经常使用】

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)