Python で python-pptx モジュールを使用して pptp テキスト コンテンツを抽出する

pptp のテキスト コンテンツを 1 つずつコピーして貼り付けるのは非常に面倒です。PowerPoint
(PPT) でテキストを抽出するには、
Python のサードパーティ ライブラリ (python-pptx など) を使用して、PPT 内のテキストを読み取って抽出します。
必要なライブラリをインストールします。pip install python-pptx
テキストを抽出するための Python コードを作成します。簡単な例を次に示します:
python
コードをコピー

from pptx import Presentation

def extract_text_from_ppt(ppt_file):
    prs = Presentation(ppt_file)
    text = ""
    for slide in prs.slides:
        for shape in slide.shapes:
            if hasattr(shape, "text"):
                text += shape.text + "\n"
    return text

# 提取文本示例
ppt_file_path = "your_presentation.pptx"  # 替换为您的PPT文件路径
extracted_text = extract_text_from_ppt(ppt_file_path)
print(extracted_text)

「your_presentation.pptx」を、テキストを抽出する実際の PPT ファイルのパスに置き換えてください。コードを実行すると、抽出されたテキストが文字列として出力されます。または、必要に応じてさらに処理することもできます。

これらの方法は、PPT からテキスト コンテンツを抽出するのに役立ちます。抽出されたテキストには、タイトル、本文、メモなどを含むスライド上のすべてのテキストが含まれる場合があることに注意してください。
ここでアドレスの問題に注意してください。

ppt_file_path = "C:\\Users\\ZSP\\Desktop\\1.pptx"

そうしないと、エラーが報告される可能性があります

おすすめ

転載: blog.csdn.net/m0_48096446/article/details/130770928