要件:特定の行数ごとに1行を抽出する必要がある大きなファイルがあります。多くの場合、ファイルをトレーニングセットと開発セットに分割するために使用されます。
awk '{if (NR%1333 == 0) print $0; }' train.all > valid.en
awk '{if (NR%1333 != 0) print $0; }' train.all > train.en
注:これは、valid.enファイルのコンテンツとして1333行ごとにデータを抽出するためのものであり、必要に応じて変更できます。