Linuxのコマンドは、重複したエントリを削除UNIQ

コマンドuniqはこの導入は、uniqのは、家族の中で、Linuxのコマンドパイプラインで、その主な機能は、重複を削除することです。

uniqのコマンドを導入する前に、/tmp/uniq.txtを使用する必要があるのは、次のような場合に新しいファイルを作成してみましょう、次のように読み込み、

 

デフォルトでは、uniqのはとても重いデータを複製するために隣接取り出します。/tmp/uniq.txtで「onmpwウェブサイトは、」3を持っているが、他の二つのうちの一つがこれだけ重い、共感「エラーPHP関数」に行って、隣接していないが、またそうです。

上記検索機構の観点から、通常の状況下でUNIQとするように並べ替えるコマンドを併用します。

#ソート1.TXT | uniqの
アルファCSSウェブ 猫のLinuxのコマンド エラーPHP関数 Hello Worldの ウェブサイトonmpw recruiseページサイトの 繰り返しデータなし welloウェブサイト

今、すべての重複は、重複排除プロセスをしてきたではありません見て。

まあ、小さなテストチョッパ後、のは簡単な紹介のオプションuniqのコマンドで始めましょう。

-c  統計データの各列の繰り返し回数

ソート1.TXT | uniqの- C 
1つのアルファのCSSウェブ 1匹の猫Linuxコマンド 2 エラーPHP関数 1つのハローワールド 3 onmpwウェブサイト 1 recruiseページサイト 1 繰り返しデータなし 1 welloウェブサイト

私たちは3回表示される「ウェブサイトonmpw」、「エラーPHP関数」が2回表示されます参照してください。残りは1にそれを複製していません。

-iは、  ケースを無視します

1.TXT「エラーPHP関数」データの行を追加

猫1 の.txt 

アルファCSSのWeb 
猫のLinuxのコマンド
エラーPHP関数
Hello Worldの
ウェブサイトonmpw 
ウェブサイトonmpw 
wello Webサイト
エラーPHP関数
recruiseページサイト
エラーPHPの関数
を繰り返していないデータ
のウェブサイトonmpw
ソート1.TXT | UNIQ -c 

1つのアルファのCSSウェブ
 1匹の猫Linuxコマンド
 2 エラーPHP関数
 1つのエラーPHP関数
 1つのハローワールド
 3つのonmpwウェブサイト
 1 recruiseページサイト
 1回の繰り返しデータなし
 1つの welloウェブサイト

私たちは、uniqはデフォルトでは大文字と小文字が区別され、その結果を見てください。-iは、大文字と小文字の問題を無視することができます使用します

 

ソート1 .TXT | UNIQ -c -i 
1つのアルファのCSSウェブ 1匹の猫Linuxコマンド 3 エラーPHP関数 1つのハローワールド 3 onmpwウェブサイト 1 recruiseページサイト 1回の繰り返しデータなし 1 welloウェブサイト

今の場合は無視されていないされて見てください。

-u  重複のない出力データのみ

ソート1 .TXT | UNIQ -iu 

アルファCSSのWeb 
猫のLinuxのコマンド
のHello World 
recruiseページサイトの
繰り返しデータなし
welloウェブサイト

それは、「エラーPHP関数」と「onmpwウェブサイト」の結果が出力されていない、しませんでした。

-w Nは  再文にN文字の最初の文字だけを取り出す開始を表します。

ソート1 .TXT | UNIQ -Iw 2つの

アルファCSSウェブ
 猫のLinuxのコマンド
 エラーPHP関数
 Hello Worldの
 ウェブサイトonmpw
 recruiseページサイト
 welloウェブサイト

ここでは、2つの文字を再しているので、この2行でも繰り返されると考えられ、繰り返しと旧リクルート、uniqの唯一の最初の2つの文字を検索してみましょう。

N -f  第N + 1つのフィールドからデータを取得開始繰り返し、スキップ最初のN個のフィールドを表します。タブまたは区切り文字としてスペース文字。

 

ソート1.TXT | UNIQ -icf 2 

1つのアルファCSSのウェブ
 1匹の猫Linuxコマンド
 3 エラーPHP関数
 1つのハローワールド
 4 onmpwウェブサイト
 1 を繰り返していないデータ
 1つの welloウェブサイト

私たちは、重いを宣告3番目のフィールドの始めから、前の二つのフィールドの上にわずかである結果、で見ることができます。同じ「recruiseページサイト」と3番目のフィールドに「onmpwウェブサイトは」、同じデータであると考えられています。私たちは、「welloウェブサイト」と「onmpwウェブサイト」を参照してくださいとしてではなく、3番目のフィールドと同じではないだけで、二つ目は同じです。なぜそれが「onmpwウェブサイト」、その中に重複したデータには含まれていません。それの前に戻って、この問題のために、UNIQは、隣接するデータが重複して検出されました。

 

この問題を解決するためにも、ソート順に進める必要があります。それのコマンドをソートする-kオプションを忘れないでください、はい、私たちが解決するためにそれを使用します。

ソート-k 2  1 .TXT | UNIQ -icf 2 

1つのアルファCSSのウェブ 1匹の猫Linuxコマンド 1 を繰り返していないデータ 1 recruiseページサイト 3 エラーPHP関数 4 onmpwウェブサイト 1ハローワールド

私たちは、解決されませんを参照してください。

Nは、-s最初のN文字をスキップ表現し、このオプションはほとんど私たちはここに引用例ではなく、Nの使用-fこのオプションを選択します。ただ、Nは、N個のフィールドである-fの前をスキップし、-sは、最初のN文字をスキップすることです。

-d  最初のストライプのデータのみが重複しています。

ソート1 .TXT | -idw uniqの2 

を繰り返していないデータ
エラーPHP関数
onmpwウェブサイト

これら三つの結果だけ。なぜ、このデータ、アプリケーションの注目-w 2の「何のデータを繰り返しません」。

-D  すべての出力の複製のために

ソート1 .TXT | UNIQ -iDw 2 

を繰り返していないデータ
recruiseページサイト
エラーPHP関数
エラーPHP関数
エラーPHP関数
ウェブサイトonmpw 
ウェブサイトonmpw 
ウェブサイトonmpw

さて、既に終了のコマンドuniqのすべての通常のオプションが導入されています。約uniqのより詳細な情報は、コマンド情報UNIQを使用することができます。

私はこの記事が役に立つことを願っています。

おすすめ

転載: www.cnblogs.com/lee-qi/p/11440518.html