sort、uniq、tr、および正規表現の仕上げ

1つは、並べ替えコマンドです

ファイルの内容は行単位で並べ替えられます。また、さまざまなデータ型に従って並べ替えることもできます。


语法格式:
sort [ 选项] 参数             #参数需要是文件
cat file | sort 选项

1一般的なオプション:


-f:忽略大小写,默认会将大写字母排在前面
-b: 忽略每行前面的空格
-n:按照数字进行排序
-r:反向排序(降序)
-u:等同于uniq,表示相同的数据仅显示一行
-t:指定字段分隔符,,默认使用tab 分隔
-k:指定排序字段
-o <输出文件>:将排序后的结果转存至指定文件

-f:
ここに画像の説明を挿入します
ここに画像の説明を挿入します

-r:

ここに画像の説明を挿入します

-t、-k、-n:


sort -t ':' -k 3 -n /etc/passwd    #使用:来分隔后的第三段,且按照顺序排列。

ここに画像の説明を挿入します
ここに画像の説明を挿入します


du -a | sort -nr -o du.txt          #把当前按照降序排序,并且写入du.txt文件中

ここに画像の説明を挿入します

2、uniqコマンド

1.uniqフォーマット

ファイル内の連続する繰り返し行を報告または無視するために使用され、多くの場合、sortコマンドと組み合わされます


语法格式:
uniq [选项] 参数
cat file | uniq 选项
常用选项
-c :进行计数,并删除文件中重复出现的行
-d :仅显示连续的重复行
-u :仅显示出现一次的行

1.1uniqは重複行を削除します:

ここに画像の説明を挿入します

1.2-c:ファイル内の繰り返し行をカウントして削除します

ここに画像の説明を挿入します

1.3-d:連続する繰り返し行のみを表示する

ここに画像の説明を挿入します

1.4 -u:一度だけ表示される行のみを表示します

ここに画像の説明を挿入します

実際のアプリケーション:

定期的な検査で使用でき
ます。サーバーが攻撃された場合、特定のIPが攻撃した回数をカウントし、特定のIPアドレスを特定し、アクセスを制限できます。

2. Uniqアプリケーション:

t1.txtは12 3 4 5 6 7
8t2.txtは13 5 7 9

例1:2つのファイルの同じ部分を比較します。

交差、つまり両方のファイルに存在する列は、並べ替え後にuniq-dコマンドを使用して実現できます。

ここに画像の説明を挿入します

例2:2つのファイルの和集合を見つける

ユニオン、つまり、2つのファイルがマージされ、重複する行が削除され、並べ替え後にuniqまたはsort-uが使用されます。
ここに画像の説明を挿入します
ここに画像の説明を挿入します

例3:2つのファイルの違いを見つけます(t1はt2に相対的ですが、t2は相対的ではありません)

# 实现思路: 差集(t1减t2), 把 t2 的行重复2次(我之前就1次的时候,出错了,结果为2个文件加一起只出现的单次了,不能这样)和 t1 的元素放到一起排序, 只输出出现一次的项

t1.txtとt2の違い:
ここに画像の説明を挿入します
エラー表示:

ここに画像の説明を挿入します

3、trコマンド

1.通常、標準入力からの文字の置換、圧縮、および削除に使用されます


语法格式:
tr [ 选项 ]  [ 参数 ]       #这里的参数不能是文件

常用选项:
-c: 保留字符集1的字符,其他的字符(包括换行符\n)用字符集2替换
-d:删除所有属于字符集1的字符
-s:将重复出现的字符串压缩为一个字符串;用字符集2 替换 字符集1
-t: 字符集2 替换 字符集1,不加选项同结果。

参数:
字符集1 :指定要转换或删除的原字符集。当执行转换操作时,必须使用参数“字符集2” 
指定转换的目标字符集。但执行删除操作时,不需要参数“字符集2”。
字符集2:指定要转换成的目标字符集。

直接変換:


echo "dauwwa" | tr 'a-z' 'A-Z'           

ここに画像の説明を挿入します

2.-c:文字セット1の文字は予約され、他の文字(改行文字を含む\ n)は文字セット2に置き換えられます

ここに画像の説明を挿入します

注:出力ステートメントの文字列の後にデフォルトの改行文字\ nがあるため、\ nを直接置き換えると、出力は同じ行になります。
ここに画像の説明を挿入します

3. -d:文字セット1に属するすべての文字を削除します

ここに画像の説明を挿入します

4. -s:繰り返し文字列を文字列に圧縮します。文字セット1を文字セット2に置き換えます。

ここに画像の説明を挿入します

二重引用符で囲まれたスペースも文字です

ここに画像の説明を挿入します
ここに画像の説明を挿入します

ここに画像の説明を挿入します

5.winから渡されたファイルシンボルの厄介な操作を解決します

ここに画像の説明を挿入します
ここに画像の説明を挿入します

第四に、配列のソート

sortの-nコマンドを使用して数値をソートすることです。


echo ${arr[@]}|tr ' ' '\n' | sort -n

ここに画像の説明を挿入します

5つの正規表現

  • 通常の入力ボックスのすべての文字形式は、正規表現によって判断されます

  • 通常、文字列が特定の形式を満たしているかどうかを確認するために判断ステートメントで使用されます

  • 正規表現は、通常の文字とメタ文字で構成されます

  • 一般的な文字には、大文字と小文字、数字、句読点、その他の記号が含まれます

  • メタ文字は、正規表現で特別な意味を持つ特殊文字です。

通常の正規表現

サポートされているツール:grep、egrep、sed、awk


基础正则表达式常见元字符:
\ :转义字符,用于取消特殊符号的含义,例:\!、\n、\$等

^ :匹配字符串开始的位置,例:^a、^the、^#、^[a-z]
 
$ :匹配字符串结束的位置,例:word$、^$匹配空行

. :匹配除\n之外的任意的一个字符,例:go.d、g..d

* :匹配前面子表达式0次或者多次,例:goo*d、go.*d

[list] :匹配list列表中的一个字符,例:go[ola]d,[abc][a-z][a-z0-9][0-9]匹配任意一位数字

[^list] :匹配任意非list列表中的一个字符,例:[^0-9][^A-Z0-9][^a-z]匹配任意一位非小写字母

\{
    
    n\} :匹配前面的子表达式n次,例:go\{
    
    2\}d、'[0-9]\{2\}'匹配两位数字

\{
    
    n,\} :匹配前面的子表达式不少于n次,例:go\{
    
    2,\}d、'[0-9]\{2,\}'匹配两位及两位以上数字

\{
    
    n,m\} :匹配前面的子表达式n到m次,例:go\{
    
    2,3\}d、'[0-9]\{2,3\}'匹配两位到三位数字

注:egrep、awk使用{
    
    n}{
    
    n,}{
    
    n,m}匹配时“{
    
    }”前不用加“\”

拡張正規表現
サポートされているツール:egrep、awk



扩展正则表达式元字符:
+ :匹配前面子表达式1次以上,例:go+d,将匹配至少一个o,如god、good、goood等

? :匹配前面子表达式0次或者1次,例:go?d,将匹配gd或god

() :将括号中的字符串作为一个整体,例1:g(oo)+d,将匹配oo整体1次以上,如good、gooood等

| :以或的方式匹配字条串,例:g(oo|la)d,将匹配good或者glad

正規表現の例:

ここに画像の説明を挿入します

ここに画像の説明を挿入します

おすすめ

転載: blog.csdn.net/weixin_44324367/article/details/111604667