Para el contenido específico del artículo, consulte: [Análisis de datos] Análisis de datos basado en texto de noticias
Adquisición de datos
De la memoria de Nueva neumonía coronaria en 2020: Informes, no ficción y narrativa personal (actualización continua) , los datos se obtienen de este artículo. Mi método es usar rastreadores para obtener la página del artículo, obtener la lista de artículos enumerados y el enlace del texto original, y luego pasar Enlace para obtener el contenido específico del artículo. A partir de 2020-2-17, obtuve 1351 enlaces. El análisis muestra que estos enlaces provienen principalmente de: cuenta pública WeChat, red financiera, red de observación económica, blog de Fangfang, tema de la red comercial de China, red de interfaz, entre 1351 enlaces El número de artículos de estos sitios web es de 1324, y el resto son solo 27, menos del 2%, y se descartan directamente. Entonces, el rastreador se utilizó para obtener el contenido del artículo del sitio web correspondiente y organizarlo en Excel.