linuxコマンドは、ファイル操作のために固定行ごとに1行を抽出します

要件:特定の行数ごとに1行を抽出する必要がある大きなファイルがあります。多くの場合、ファイルをトレーニングセットと開発セットに分割するために使用されます。

    awk '{if (NR%1333 == 0)  print $0; }' train.all > valid.en
    awk '{if (NR%1333 != 0)  print $0; }' train.all > train.en

注:これは、valid.enファイルのコンテンツとして1333行ごとにデータを抽出するためのものであり、必要に応じて変更できます。

おすすめ

転載: blog.csdn.net/Answer3664/article/details/108090169
おすすめ