Python crawler + análisis de datos + pantalla visual, analice el comentario de "Changjin Lake Water Gate Bridge"

Las películas de Wu Jing en los últimos años son muy ricas en sentimientos nacionales. A los adultos y niños les encanta verlas. Cada vez que alcanzan un récord en la taquilla. ¿Has visto las dos últimas películas del lago Changjin? El puente no está mal, hasta el momento cuenta con 3.672 millones de taquilla.

Directorio de artículos

Cierto ojo tiene una puntuación de 9, 6 y cierta válvula tiene una puntuación de 7, 2. La taquilla diaria en febrero es básicamente la primera de todos los días, pero ¿por qué es tan atractiva? Usemos python para ver lo que dice la gente que lo ha visto~
inserte la descripción de la imagen aquíinserte la descripción de la imagen aquí

1. Preparación

La parte del rastreador necesita usar estos módulos

requests
parsel   
csv

Los dos primeros deben instalarse, presione win + r en el teclado para abrir el cuadro de ejecución, ingrese cmd y luego confirme, luego ingrese el nombre del módulo de instalación de pip y presione Entrar para instalar.

Ver mi artículo principal para más detalles

2. Código

El código es solo para referencia, no lo analizaré uno por uno, y grabé una explicación en video de diez minutos, los hermanos que no saben pueden seguir el video para aprender.

[Colección de casos de Python] Uno en diez minutos, ¡es tan eficiente! Se siguen actualizando más casos...

Esta es también una colección de videos, que se está actualizando lentamente. Puedes verla en tres enlaces~

código

import csv
import requests
import parsel

headers = {
    
    
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/98.0.4758.102 Safari/537.36'
}
for page in range(1, 20):
    url = f'...../subject/35613853/comments?start={
      
      page*20}&limit=20&status=P&sort=new_score'
    data_html = requests.get(url=url, headers=headers).text
    selector = parsel.Selector(data_html)
    comment_list = selector.css('.comment-item')
    for comment in comment_list:
        short = comment.css('.short::text').get().strip()
        name = comment.css('.comment-info a::text').get().strip()
        time = comment.css('.comment-time::text').get().strip()
        vote_count = comment.css('.votes.vote-count::text').get().strip()
        print(short, name, time, vote_count)
        with open('长津湖.csv', mode='a', encoding='utf-8', newline='') as f:
            csv_writer = csv.writer(f)
            csv_writer.writerow([short, name, time, vote_count])

Diagrama de nube de palabras y análisis de datos, hay una explicación súper detallada esta noche, mira el método en el lado izquierdo de mi página de inicio

Hermanos, vayan y pruébenlo. Si tienen alguna pregunta, bienvenidos a comunicarse en el área de comentarios después de tres conexiones consecutivas ~

Supongo que te gusta

Origin blog.csdn.net/fei347795790/article/details/123048543
Recomendado
Clasificación