国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 服務器 > 管理維護 > 正文

Awk學習筆記

2024-09-10 14:18:53
字體:
來源:轉載
供稿:網友

整理:Jims of 肥肥世家

第一次發布時間:2004年8月6日


Table of Contents

1. awk簡介
2. awk命令格式和選項
2.1. awk的語法有兩種形式
2.2. 命令選項
3. 模式和操作
3.1. 模式
3.2. 操作
4. awk的環境變量
5. awk運算符
6. 記錄和域
6.1. 記錄
6.2. 域
6.3. 域分隔符
7. gawk專用正則表達式元字符
8. POSIX字符集
9. 匹配操作符(~)
10. 比較表達式
11. 范圍模板
12. 一個驗證passwd文件有效性的例子
13. 幾個實例
14. awk編程
14.1. 變量
14.2. BEGIN模塊
14.3. END模塊
14.4. 重定向和管道
14.5. 條件語句
14.6. 循環
14.7. 數組
14.8. awk的內建函數
15. How-to

1. awk簡介

awk是一種編程語言,用于在linux/unix下對文本和數據進行處理。數據可以來自標準輸入、一個或多個文件,或其它命令的輸出。它支持用戶自定義函數和動態正則表達式等先進功能,是linux/unix下的一個強大編程工具。它在命令行中使用,但更多是作為腳本來使用。awk的處理文本和數據的方式是這樣的,它逐行掃描文件,從第一行到最后一行,尋找匹配的特定模式的行,并在這些行上進行你想要的操作。如果沒有指定處理動作,則把匹配的行顯示到標準輸出(屏幕),如果沒有指定模式,則所有被操作所指定的行都被處理。awk分別代表其作者姓氏的第一個字母。因為它的作者是三個人,分別是Alfred Aho、Brian Kernighan、Peter Weinberger。gawk是awk的GNU版本,它提供了Bell實驗室和GNU的一些擴展。下面介紹的awk是以GUN的gawk為例的,在linux系統中已把awk鏈接到gawk,所以下面全部以awk進行介紹。

2. awk命令格式和選項

2.1. awk的語法有兩種形式

  • awk [options] 'script' var=value file(s)

  • awk [options] -f scriptfile var=value file(s)

2.2. 命令選項

-F fs or --field-separator fs

指定輸入文件折分隔符,fs是一個字符串或者是一個正則表達式,如-F:。

-v var=value or --asign var=value

賦值一個用戶定義變量。

-f scripfile or --file scriptfile

從腳本文件中讀取awk命令。

-mf nnn and -mr nnn

對nnn值設置內在限制,-mf選項限制分配給nnn的最大塊數目;-mr選項限制記錄的最大數目。這兩個功能是Bell實驗室版awk的擴展功能,在標準awk中不適用。

-W compact or --compat, -W traditional or --traditional

在兼容模式下運行awk。所以gawk的行為和標準的awk完全一樣,所有的awk擴展都被忽略。

-W copyleft or --copyleft, -W copyright or --copyright

打印簡短的版權信息。

-W help or --help, -W usage or --usage

打印全部awk選項和每個選項的簡短說明。

-W lint or --lint

打印不能向傳統unix平臺移植的結構的警告。

-W lint-old or --lint-old

打印關于不能向傳統unix平臺移植的結構的警告。

-W posix

打開兼容模式。但有以下限制,不識別:x、函數關鍵字、func、換碼序列以及當fs是一個空格時,將新行作為一個域分隔符;操作符**和**=不能代替^和^=;fflush無效。

-W re-interval or --re-inerval

允許間隔正則表達式的使用,參考(grep中的Posix字符類),如括號表達式[[:alpha:]]。

-W source program-text or --source program-text

使用program-text作為源代碼,可與-f命令混用。

-W version or --version

打印bug報告信息的版本。

3. 模式和操作

awk腳本是由模式和操作組成的:

pattern {action} 如$ awk '/root/' test,或$ awk '$3 < 100' test。

兩者是可選的,如果沒有模式,則action應用到全部記錄,如果沒有action,則輸出匹配全部記錄。默認情況下,每一個輸入行都是一條記錄,但用戶可通過RS變量指定不同的分隔符進行分隔。

3.1. 模式

模式可以是以下任意一個:

  • /正則表達式/:使用通配符的擴展集。

  • 關系表達式:可以用下面運算符表中的關系運算符進行操作,可以是字符串或數字的比較,如$2>%1選擇第二個字段比第一個字段長的行。

  • 模式匹配表達式:用運算符~(匹配)和~!(不匹配)。

  • 模式,模式:指定一個行的范圍。該語法不能包括BEGIN和END模式。

  • BEGIN:讓用戶指定在第一條輸入記錄被處理之前所發生的動作,通常可在這里設置全局變量。

  • END:讓用戶在最后一條輸入記錄被讀取之后發生的動作。

3.2. 操作

操作由一人或多個命令、函數、表達式組成,之間由換行符或分號隔開,并位于大括號內。主要有四部份:

  • 變量或數組賦值

  • 輸出命令

  • 內置函數

  • 控制流命令

4. awk的環境變量

Table 1. awk的環境變量

變量描述
$n當前記錄的第n個字段,字段間由FS分隔。
$0完整的輸入記錄。
ARGC命令行參數的數目。
ARGIND命令行中當前文件的位置(從0開始算)。
ARGV包含命令行參數的數組。
CONVFMT數字轉換格式(默認值為%.6g)
ENVIRON環境變量關聯數組。
ERRNO最后一個系統錯誤的描述。
FIELDWIDTHS字段寬度列表(用空格鍵分隔)。
FILENAME當前文件名。
FNR同NR,但相對于當前文件。
FS字段分隔符(默認是任何空格)。
IGNORECASE如果為真,則進行忽略大小寫的匹配。
NF當前記錄中的字段數。
NR當前記錄數。
OFMT數字的輸出格式(默認值是%.6g)。
OFS輸出字段分隔符(默認值是一個空格)。
ORS輸出記錄分隔符(默認值是一個換行符)。
RLENGTH由match函數所匹配的字符串的長度。
RS記錄分隔符(默認是一個換行符)。
RSTART由match函數所匹配的字符串的第一個位置。
SUBSEP數組下標分隔符(默認值是 主站蜘蛛池模板: 兴安县| 隆昌县| 双柏县| 玉林市| 周口市| 伊通| 濉溪县| 石景山区| 西平县| 丹东市| 垫江县| 申扎县| 双牌县| 乃东县| 台中市| 秦安县| 攀枝花市| 绥阳县| 团风县| 衡阳县| 通榆县| 博兴县| 鄂托克旗| 杭锦旗| 永济市| 广汉市| 永川市| 延寿县| 安宁市| 洛阳市| 昌宁县| 大方县| 方城县| 凤山县| 邛崃市| 兰溪市| 墨玉县| 犍为县| 巍山| 南宁市| 镇康县|