如果不知道干什么,那就學(xué)習(xí)吧
目錄
正文
【參考文章】:linux awk命令詳解
【參考文章】:awk 入門(mén)教程——阮一峰的網(wǎng)絡(luò)日志
【參考文章】:awk substr()函數(shù)
【傳送門(mén)】:awk命令系列學(xué)習(xí)
awk 是一種處理文本文件的語(yǔ)言,是一個(gè)強(qiáng)大的文本分析工具。
awk 其實(shí)不僅僅是工具軟件,還是一種編程語(yǔ)言。
awk 是以文件的一行內(nèi)容為處理單位的。awk讀取一行內(nèi)容,然后根據(jù)指定條件判斷是否處理此行內(nèi)容,若此行文本符合條件,則按照動(dòng)作處理文本,否則跳過(guò)此行文本,讀取下一行進(jìn)行判斷。
condition:條件。若此行文本符合該條件,則按照 action 處理此行文本。不添加條件時(shí)則處理每一行文本;
action:動(dòng)作。按照動(dòng)作處理符合要求的內(nèi)容。一般用于打印指定的內(nèi)容信息;
注意下面的引號(hào)為英文的單引號(hào)
awk 'condition { action }' filename
command | awk ' condition { action }'
默認(rèn)使用空格作為分隔符。
[root@localhost awk]# echo "aa bb cc dd ee ff" | awk '{print $1}'aa[root@localhost awk]# echo "aa bb l cc dd l ee ff" | awk -F 'l' '{print $1}'aa bb [root@localhost awk]# echo "aa bb cc : dd ee ff" | awk -F ':' '{print $1}'aa bb cc
默認(rèn)是空格和制表符。
$0 表示當(dāng)前整行內(nèi)容,$1,$2 表示第一個(gè)字段,第二個(gè)字段
[root@localhost zabbix_agentd.d]# echo "aa bb cc dd" | awk '{ print $0}'aa bb cc dd[root@localhost zabbix_agentd.d]# echo "aa bb cc dd" | awk '{ print $1}'aa[root@localhost zabbix_agentd.d]# echo "aa bb cc dd" | awk '{ print $2}'bb
$NF就代表最后一個(gè)字段,$(NF-1)代表倒數(shù)第二個(gè)字段
[root@localhost zabbix_agentd.d]# echo "aa bb cc dd" | awk '{ print $NF}'dd[root@localhost zabbix_agentd.d]# echo "aa bb cc dd" | awk '{ print $(NF-1)}'cc
打印當(dāng)前行號(hào)和當(dāng)前文本內(nèi)容
[root@localhost awk]# cat test.txt aa ssdd ffgg hh[root@localhost awk]# cat test.txt | awk '{print NR")", $0}'1) aa ss2) dd ff3) gg hh
逗號(hào)表示輸出的變量之間用空格分隔;
右括號(hào)必需使用 雙引號(hào) 才可以原樣輸出
[root@localhost awk]# awk '{print FILENAME, NR")", $0}' test.txt test.txt 1) aa sstest.txt 2) dd fftest.txt 3) gg hh[root@localhost awk]# cat test.txt | awk '{print FILENAME, NR")", $0}'- 1) aa ss- 2) dd ff- 3) gg hh
awk '{ condition action }' filename 這種形式時(shí)可以打印文件名;
通過(guò) |(管道符)讀取內(nèi)容時(shí)打印的是 -
awk中同時(shí)提供了print和printf兩種打印輸出的函數(shù)。
print函數(shù),參數(shù)可以是變量、數(shù)值或者字符串。字符串必須用雙引號(hào)引用,參數(shù)用逗號(hào)分隔。如果沒(méi)有逗號(hào),參數(shù)就串聯(lián)在一起而無(wú)法區(qū)分。這里,逗號(hào)的作用與輸出文件的分隔符的作用是一樣的,只是后者是空格而已。
printf函數(shù),其用法和c語(yǔ)言中printf基本相似,可以格式化字符串,輸出復(fù)雜時(shí),printf更加好用,代碼更易懂。
[root@localhost awk]# echo "aa bb cc dd ee ff" | awk '{print toupper($1)}'AA[root@localhost awk]# echo "aa BB cc dd ee ff" | awk '{print tolower($2)}'bb[root@localhost awk]# echo "aa BB cc dd ee ff" | awk '{print length($2)}'2[root@localhost awk]# echo "asdfghj" | awk '{print substr($1,2,3)}'sdf
awk 允許指定輸出條件,只輸出符合條件的行。
awk ' 條件 {動(dòng)作 }' 文件名
條件有以下幾種:
特殊字符需要轉(zhuǎn)義
[root@localhost awk]# cat exp.txt /stsvc/fms/conf/application.yml/stsvc/sms/conf/application.yml/stsvc/tms/conf/application.yml/root/home/chenfan/root/home/jhhuang[root@localhost awk]# cat exp.txt | awk '/stsvc/ {print $0}' 包含 stsvc 的行/stsvc/fms/conf/application.yml/stsvc/sms/conf/application.yml/stsvc/tms/conf/application.yml[root@localhost awk]# cat exp.txt | awk '/stsvc\/fms/ {print $0}' 包含 stsvc/fms 的行/stsvc/fms/conf/application.yml
[root@localhost awk]# cat exp.txt | awk 'NR==2 {print $0}' 等于第二行/stsvc/sms/conf/application.yml[root@localhost awk]# cat exp.txt | awk 'NR>4 {print $0}' 大于第四行/root/home/jhhuang[root@localhost awk]# cat exp.txt | awk 'NR%2==1 {print $0}' 奇數(shù)行/stsvc/fms/conf/application.yml/stsvc/tms/conf/application.yml/root/home/jhhuang
某個(gè)字段等于具體值
[root@localhost awk]# cat test.txt aa ssdd ffgg hh[root@localhost awk]# cat test.txt | awk ' $2=="ff" {print $0}'dd ff
[root@localhost awk]# echo "aa ss dd" | awk '{ if($3 == "dd") print $0; else print "nothing"}'aa ss dd[root@localhost awk]# echo "aa ss dds" | awk '{ if($3 == "dd") print $0; else print "nothing"}'nothing
聯(lián)系客服