Pythonのバッチマージテキストファイル

ディレクトリ

(有名なMOOCプラットフォーム)上Courselaで、これらの日は、コースに登録:ジョージア工科大学は、機械設計にオープンしました。

機械設計は、主に静的および疲労損傷理論、一般的な機械的構造、機械システムの設計などとして損害について、専門性の高いコースです。

全体的な情報やコースのカリキュラムを見て、コースは、英語では何も中国のリソースを教えていません。そして、いくつかの前の仕事や学校生活、しかし、唯一の中国のレベル、英語のレベルや空白の状態では、これらの言葉を理解することが、機械専門の用語の多くを使用しています。特に、次の週のコースの主な内容を理解するために、学ぶために毎週の開始前に最初のドラフトプレビュー字幕:研究の後ろにスムーズに確保するために、私はダウンカリキュラム字幕ビデオのダウンロードを起草し、自分自身のための計画を行います独自の名前に関連する機械を使用します。

第1の円周最終ダウンロード完了提出はるかにより11重量部です。調査以来Python、その後、使用しPythonたバッチの提出でTXTファイルを読み取り、まとめ、統一し、それを保存するプログラムを書くためにMarkdownドキュメント。このように、私たちは、オープン11回の繰り返しを避けることができますコピーして貼り付けるのtxtファイルを開いてMarkdown、退屈な文書を変換効率を向上させることができます。

まず、必要な材料

  • いくつかの草案テキスト字幕ファイル
  • Pythonの開発環境

第二に、ステップ

  • 文書を開くと、ファイル内のキャプション草案テキストの内容を読み取るために反復することで

    # 迭代读取字幕稿文本文档中的内容
    for n in range(rangew):
      f=open(fname,encoding='utf-8')
      ftxt = f.read()
      text.append(ftxt)

    どこで:

    変数fnameファイルのファイル名を格納します。

    Pythonのが提供するTXT文書のコンテンツfile.read()取得方法、およびアサイン内容がテキストを取得しますftxt

    変数textとしてList文書の各字幕バージョンの内容を記憶します。List.append()方法ftxtに追加されたコンテンツのtextこのList媒体。

  • 新しい取得したコンテンツを保存しMarkdownた文書

    テストした後、Pythonは開いたり保存することができますMarkdownファイルを:

    # 写入Markdown文档
    fmd = open('subtitle.md','w')
    for t in range(len(text)):
      fmd.write(text[t])
    fmd.close()

    ここでは、最初のPythonに適用されるopen()機能:open()この関数は、ファイルを開くために使用することができ、作成しfileたオブジェクトを。

    open()関数は、2つのパラメータを取る:れている文件名name、すなわち、上記のtranscript.md、他のパターンであるmode、すなわち、上記の、開かれたファイルを決定しますwopen()作成されたと呼ばれる機能をオープンし、プログラムsubtitle.md文書。

    書かれて得るために、コンテンツの上部を横断した後Markdownのドキュメントを。

  • ライト効果

    特許文献1の図オペレーションコード生成トップ

    (2人のクローズドキャプションの間)図オペレーションコード生成文書2

    要約すると、プログラムの機能を完了することが、原稿をまとめた後、本当に快適に見えました:

    1. 結果のファイルはすぐに別のディレクトリ字幕ドラフトを見つけるには不便ではありません。
    2. 異なる字幕の間に明確な境界は、読み、検索する不便を起草しません。
    3. 例文の句読点がビデオを次の、真ん中には不便を読んで、オフに改行がたくさんあります。

第三に、修正

分析は、実際には、解決するのは非常に簡単です:

  1. Markdown文書は、カタログ

    Markdownディレクトリに参加することで、あなただけの文書の本文の前に ``追加することができます。

    文書書かれたにかつての最初のドラフトで書かれたキャプション、ここで[toc]のソリューションを。

  2. テキストのタイトルを増やし

    認知度や文書で読みやすいを高めるためには、あなたが開始する位置に、各キャプション案にタイトルを追加する必要があります。

    ここで前部及び増加的に対応する後、取得した文字列によって解決しました。

  3. 検索や文書内の改行を置き換えます\n

    ここで使用して、選択したテキストの改行方法を空間に、交換してください。Pythonreplace()\n

    replace()入力方法は、2つのパラメータ、古い文字列(文字列を交換する必要がある)、(必須)すなわち、第二引数に新しい文字列である最初のパラメータが必要です。

改訂コード:

# 1 迭代读取字幕稿文本文档中的内容
for n in range(rangew):
    f=open(fname,encoding='utf-8')
    ftxt = f.read()
    
    # 替换换行符为空格
    chtxt = ftxt.replace('\n', ' ')
    
    # 为Markdown文档插入标题
    addfilename = '#Subtitle-' + str(n+1) + '\n' + chtxt 
    text.append(addfilename)
    
# 2 写入Markdown文档
fmd = open('transcript.md','w+')

# 写入目录
fmd.write('[toc]\n')

for t in range(len(text)):
    fmd.write(text[t])
    
    # 当前文档内容写入完成后加入换行符隔开两段内容
    fmd.write('\n')
fmd.close()

結果を操作するコードの変更後:

図3は、変更された文書コードを生成します

図修正されたコード生成文書4(両者のクローズドキャプション)

IVの概要

比較の前と後のコードの変更生成されたMarkdown文書を、文書のカラーコードの値が大幅に読みするのは非常に簡単、修正増やします。

出会いで働いた後、完全な達人ができ、あなたが自分自身のために考えるために多くの時間を節約することができ、コードを調整し、転写産物のバッチの概要が必要です。

おすすめ

転載: www.cnblogs.com/mrsin/p/12514279.html
おすすめ