Captura de datos de máscara
Visión general
La reciente epidemia en Wuhan ha atraído la atención de todo el país hacia esta ciudad. El editor está estudiando imágenes en esta ciudad. Recientemente, a menudo recibo saludos ocasionales de amigos, que son imágenes muy conmovedoras. Ante la epidemia, lo que podemos hacer en la actualidad es no creer en los rumores y no difundir rumores, hacer nuestro mejor esfuerzo para hacer nuestra propia higiene y protegernos. Como resultado, varias máscaras han comenzado a estar agotadas (N95), y muchas personas tienen que comprar máscaras en línea. Esta es parte de la adquisición de datos de la columna de máscara en la lista de productos de Jingdong para ayudar a todos a elegir. Les deseo a todos sanos y felices. Si desea obtener el código o los datos, escriba la imagen en privado.
Proceso de realización y resultados
Es una tecnología de rastreo ordinaria, que utiliza datos de representación JS. BeautifulSoup analiza los datos. Finalmente, los datos se almacenan en una tabla de Excel local para su uso posterior.
En la Figura 3, podemos ver que Xianxingzhe y Lude son los más vendidos (datos obtenidos, nada que ver con el editor)
Parte del código es el siguiente
list = soup.find(class_='gl-warp clearfix').find_all(class_='gl-item')
for item in list:
item_product_id = item.find(class_='gl-i-wrap j-sku-item').get('data-sku')
if len(item.find(class_='p-name').find_all('span')) == 2:
item_product_name_be = item.find(class_='p-name').find('em').text.strip('span').split(" ")
item_product_name = item_product_name_be[len(item_product_name_be) - 1]
else:
item_product_name = item.find(class_='p-name').find('em').text
item_product_price = item.find(class_='J_price').text.replace('¥', '')
if len(item.find(class_='p-shop')) != 0:
item_stroe_name = item.find(class_='p-shop').find('a').get('title')
else:
item_stroe_name = "~"
item_product_info_all = item.find(class_='p-icons J-pro-icons').text
item_product_link1 = item.find(class_='p-img').find('a').get('href')
item_product_link = item.find(class_='comment').text
print(item_product_link)