¡Hola a todos! Soy un panda rojo ❤
Como todos sabemos, un comentario siempre ha sido encriptado con JS,
Por lo tanto, la subcontratación siempre ha sido costosa, y algunas empresas incluso la usan para entrevistas,
Puedes ver su dificultad.
Pero, parece que no ha encriptado recientemente, esto~
¡No vale nada!
En ese momento, no pude evitarlo, ¡y tuve que comenzar a trabajar en ello con Python!
Si tiene alguna respuesta de error relacionada con Python que no puede responder, o el código fuente/instalación del módulo/
jefes de ropa de mujer son expertosen habilidades, puede venir aquí: (https://jq.qq.com/?_wv= 1027&k=2Q3YTfym) o +V: python10010 pregúntame
Sin más preámbulos, ¡vamos al código!
1. Todo el código
¡No hay tantos pasos hoy, vaya directamente al código!
import requests
import parsel
url = 'https://www.dianping.com/search/keyword/344/0_%E7%81%AB%E9%94%85/p2'
headers = {
'Cookie': 'fspop=test; cy=344; cye=changsha; _lxsdk_cuid=181f2b8ceedc8-00c68dfc700b1e-c4c7526-384000-181f2b8ceedc8; _lxsdk=181f2b8ceedc8-00c68dfc700b1e-c4c7526-384000-181f2b8ceedc8; _hc.v=fa46cfdd-99f6-80af-c226-f8777fc1f097.1657634607; s_ViewType=10; _lx_utm=utm_source%3DBaidu%26utm_medium%3Dorganic; Hm_lvt_602b80cf8079ae6591966cc70a3940e7=1657634608,1657690542; lgtoken=0ecd60582-14f9-4437-87ad-7b55881b56df; WEBDFPID=3x389w8ww1vw5vuzy491zvxxu36989x2818u39v38389795895568429-1657776946569-1657690545731QSUUAWGfd79fef3d01d5e9aadc18ccd4d0c95072230; dper=6cfaf0f82f34d241b584d587fc92a7117ba6c082354d350ed861c0a256d00ba3beb93db7dc5485b4e2e4e4085a92126fa2e5f1dbe1b6eaefd1c814167fce943e; ll=7fd06e815b796be3df069dec7836c3df; Hm_lpvt_602b80cf8079ae6591966cc70a3940e7=1657690573; _lxsdk_s=181f60e4e6c-cad-fea-c91%7C%7C40',
'Host': 'www.dianping.com',
'Referer': 'https://www.dianping.com/search/keyword/344/0_%E7%81%AB%E9%94%85',
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.0.0 Safari/537.36',
}
response = requests.get(url=url, headers=headers)
selector = parsel.Selector(response.text)
href = selector.css('.shop-list ul li .pic a::attr(href)').getall()
print(href)
for index in href:
html_data = requests.get(url=index, headers=headers).text
selector_1 = parsel.Selector(html_data)
title = selector_1.css('.shop-name::text').get() # 店名
count = selector_1.css('#reviewCount::text').get() # 评论
Price = selector_1.css('#avgPriceTitle::text').get() # 人均消费
item_list = selector_1.css('#comment_score .item::text').getall() # 评价
taste = item_list[0].split(': ')[-1] # 口味评分
environment = item_list[1].split(': ')[-1] # 环境评分
service = item_list[-1].split(': ')[-1] # 服务评分
address = selector_1.css('#address::text').get() # 地址
tel = selector_1.css('.tel ::text').getall()[-1] # 电话
dit = {
'店名': title,
'评论': count,
'人均消费': Price,
'口味': taste,
'环境': environment,
'服务': service,
'地址': address,
'电话': tel,
'详情页': index,
}
print(dit)
No comentaré los comentarios, tengo prisa, ¡mi amigo de la escultura de arena me llamó para comer!
2. Visualización de efectos
El código de este artículo solo rastrea parte del contenido. El video también explica cómo hacer que los datos se vean mejor, rastrear varias páginas, guardar tablas de Excel, etc.
Mostrarte el efecto
El efecto se muestra aquí~ Después de todo, mi amigo todavía está esperando mi comida~