Tutorial de Python sobre cómo obtener subtítulos de animación de películas y extraer palabras para aprender, tome SpongeBob SquarePants como ejemplo srt (el tutorial incluye el código fuente Opensubtitles)

necesidad

Para mejorar el nivel de inglés de los niños, se planea agudizar los oídos de los niños a través del sonido original. Los niños están más interesados ​​en SpongeBob SquarePants (SpongeBob SquarePants), pero SpongeBob solo tiene versiones en chino o inglés en plataformas nacionales, sin subtítulos compatibles. Este artículo proporcionará un método para descargar el conjunto completo de subtítulos de SpongeBob SquarePants y proporcionará un código para extraer palabras.

Obtener subtítulos completos

OpenSubtitles.org es un sitio web para cargar y descargar subtítulos de películas. El sitio web tiene una base de datos de subtítulos de películas multilingüe con más de 30 idiomas para que los usuarios elijan a voluntad. El sitio web permite a los usuarios buscar subtítulos de películas para cargar y descargar a través de tipos de películas, clasificaciones de bases de datos de películas en Internet, años de estreno de películas, etc. Los resultados de la búsqueda se pueden enviar a los usuarios por correo electrónico o RSS. El sitio web de OpenSubtitles también es compatible con aplicaciones de terceros.

cómo llegar

Puede visitar este sitio web para buscar las películas o dibujos animados que necesita.Debido a las limitaciones de este sitio web, puede descargarlos de las siguientes maneras

http://dl.opensubtitles.org/en/download/sub/字幕id

Por favor agregue una descripción de la imagen
Puede colocar el mouse en el enlace de descarga de subtítulos para obtener la identificación del subtítulo, como 7372104 en la imagen

Analizar archivo de subtítulos src

import re

def extract_words_from_srt_file(file_path):
    with open(file_path, 'r', encoding='utf-8') as file:
        srt_content = file.read()

    # 删除时间戳和其他无关的字符
    c

Supongo que te gusta

Origin blog.csdn.net/iCloudEnd/article/details/131990679
Recomendado
Clasificación