テール和ヘッド
- ファイルのREADME.txtの最初の数行を見ます
head README.txt # see first 10 lines of the README.txt
head -n 50 README.txt # see first 50 lines of the README.txt
- ファイルのREADME.txtの最後の数行を見ます
tail README.txt # see the last 10 lines of file README.txt
tail -30 README.txt | head -10 # first ten lines of the last 30 lines
ワードカウント(WCコマンド)
- ファイル内の行数を取得します
wc -l README.txt # calculate how many lines in the file README.txt
スプリット
- ファイルは、他のいくつかの大規模なサブファイルに分割して
split -l 1000 README.txt # split file into sub_files that have 1000 lines each
シャッフル
- シャッフルデータセットし、その後、分割、データ収集時間のための機械学習は有用であろう!
shuf MQ2007 | split -l 1000 # shuffle and then split
ネコ
- コマンドラインインターフェイスへのファイルの内容(その後のコンテンツを取ることができます)
cat file | grep 'carneige mellon university' # show all lines with 'cmu' to command line
UNIQ
- Linuxのuniqのコマンドラインをチェックし、定期的なテキストファイルを削除し、一般的にsortコマンドと組み合わせて使用する - 「ルーキーチュートリアル」からの抜粋
sort testfile1 | uniq -c # 先对文件排序,在去重,在标准输出显示每一行重复的次数