Captura de dados de máscara
Visão geral
A recente epidemia em Wuhan atraiu a atenção de todo o país para esta cidade. O editor está estudando fotos nesta cidade. Recentemente, recebo frequentemente saudações de amigos, que são imagens muito comoventes. Diante da epidemia, o que podemos fazer no momento é não acreditar em boatos e não espalhar boatos, e tentar o nosso melhor para fazer nossa própria higiene e nos proteger. Portanto, várias máscaras começaram a ser vendidas (N95), e muitas pessoas têm que entrar na Internet para comprar máscaras. Aqui está parte da aquisição de dados da coluna de máscara na lista de produtos Jingdong para ajudar todos a escolher. Desejo a todos saudáveis e felizes. Se você deseja obter o código ou os dados, escreva a imagem em particular.
Processo de realização e resultados
É uma tecnologia de rastreador comum, que usa JS para renderizar dados. BeautifulSoup analisa os dados. Finalmente, os dados são armazenados em uma tabela Excel local para uso posterior.
Na Figura 3, podemos ver que Xianxingzhe e Lude são os mais vendidos (os dados não estão relacionados ao editor)
Parte do código é o seguinte
list = soup.find(class_='gl-warp clearfix').find_all(class_='gl-item')
for item in list:
item_product_id = item.find(class_='gl-i-wrap j-sku-item').get('data-sku')
if len(item.find(class_='p-name').find_all('span')) == 2:
item_product_name_be = item.find(class_='p-name').find('em').text.strip('span').split(" ")
item_product_name = item_product_name_be[len(item_product_name_be) - 1]
else:
item_product_name = item.find(class_='p-name').find('em').text
item_product_price = item.find(class_='J_price').text.replace('¥', '')
if len(item.find(class_='p-shop')) != 0:
item_stroe_name = item.find(class_='p-shop').find('a').get('title')
else:
item_stroe_name = "~"
item_product_info_all = item.find(class_='p-icons J-pro-icons').text
item_product_link1 = item.find(class_='p-img').find('a').get('href')
item_product_link = item.find(class_='comment').text
print(item_product_link)