【Análisis de datos】 -Basado en el análisis de datos de texto de noticias de neumonía

Para el contenido específico del artículo, consulte: [Análisis de datos] Análisis de datos basado en texto de noticias

Adquisición de datos

      De la memoria de Nueva neumonía coronaria en 2020: Informes, no ficción y narrativa personal (actualización continua) , los datos se obtienen de este artículo. Mi método es usar rastreadores para obtener la página del artículo, obtener la lista de artículos enumerados y el enlace del texto original, y luego pasar Enlace para obtener el contenido específico del artículo. A partir de 2020-2-17, obtuve 1351 enlaces. El análisis muestra que estos enlaces provienen principalmente de: cuenta pública WeChat, red financiera, red de observación económica, blog de Fangfang, tema de la red comercial de China, red de interfaz, entre 1351 enlaces El número de artículos de estos sitios web es de 1324, y el resto son solo 27, menos del 2%, y se descartan directamente. Entonces, el rastreador se utilizó para obtener el contenido del artículo del sitio web correspondiente y organizarlo en Excel.

                            

 

Publicado 314 artículos originales · 22 alabanzas · Más de 20,000 visitas

Supongo que te gusta

Origin blog.csdn.net/qq_39451578/article/details/105450536
Recomendado
Clasificación