PythonはGoogle翻訳を使用して字幕ファイルを翻訳します

PythonはGoogle Translate APIを使用して字幕ファイルを翻訳します

英語の字幕は本当に頭痛の種なので、1日かけて勉強し、Pythonで比較的単純な翻訳コードを実装しました。ほんの数十行

最初にモジュールをロードします

pip uninstall googletrans
git clone https://github.com/BoseCorp/py-googletrans.git
cd ./py-googletrans && python setup.py install

テストを使用

from googletrans import Translator

# 实例化
translator = Translator(service_urls=['translate.google.cn'])

content = 'Today is a gooday'

print(translator.translate(content, dest='zh-CN').text.encode('utf-8').decode('utf-8'))

出力は問題ありません

アイデア:
ファイルの内容を1行ずつ読み、特定の行の字幕を翻訳します。非常に簡単ですが、エンコードの問題に注意する必要があります


from googletrans import Translator
# encoding=utf-8
import argparse


def main(args):
    # 实例化
    translator = Translator(service_urls=['translate.google.cn'])
    f = open(args.fs, 'r+', encoding="utf-8")
    flist = f.readlines()
    f = open(args.fs, 'w+', encoding="utf-8")
    f.writelines(flist)
    for x in range(4, len(flist)):
        if x % 4 == 0:
            print(x)
            flist[x] = translator.translate(flist[x], dest='zh-CN').text.encode('utf-8').decode('utf-8') + "\n"
            print(translator.translate(flist[x], dest='zh-CN').text.encode('utf-8').decode('utf-8'))
            f = open(args.fs, 'w+', encoding="utf-8")
            f.writelines(flist)


if __name__ == '__main__':
    parser = argparse.ArgumentParser(usage="it's usage tip.", description="help info.")
    parser.add_argument("--fs", type=str, required=True, help="the fileloacation")
    args = parser.parse_args()
    main(args)

デモを使用:

python   tran.py  --fs  "D:\xiaxiaxia\pycharmtext\a.vtt"

注意が必要な事項
読み、行ごとに処理してから、書き込みおよび開くときにエンコードに注意してください。書き込み時には、エラーが発生しないように、末尾に改行文字\ nを追加する必要があります。

コードはまだ比較的単純で、利害関係者はio処理と同時実行性を最適化できます。

おすすめ

転載: blog.csdn.net/xia_xu_liang/article/details/108694184