Paquete de captura de Python y análisis del rastreador json

Paquete de captura de Python y análisis del rastreador json

Al usar el rastreador de Python, al capturar la URL y abrir la URL, es posible que encuentre la siguiente URL similar. Después de abrir, aparecerá una interfaz similar a esta y el rastreador no puede continuar:
Inserte la descripción de la imagen aquí

Por ejemplo: cuando
necesite rastrear los datos en la segunda página de una página web, haga clic en F12➡Network➡XHR, es mejor hacer clic en el botón borrar, como se muestra en la siguiente figura:
Inserte la descripción de la imagen aquí
Al hacer clic en la "segunda página", aparecerá una solicitud POST (a veces GET request), haga clic en la URL de la solicitud POST, (aquí, tome la solicitud POST como ejemplo), como se muestra en la figura:
Inserte la descripción de la imagen aquíluego copie el código del parámetro

Visualización de código:

import requests
import json

url = 'https://m.ctrip.com/restapi/soa2/13444/json/getCommentCollapseList?_fxpcqlniredt=09031130211378497389'

header={
    
    
'authority': 'm.ctrip.com',
'method': 'POST',
'path': '/restapi/soa2/13444/json/getCommentCollapseList?_fxpcqlniredt=09031130211378497389',
'scheme': 'https',
'accept': '*/*',
'accept-encoding': 'gzip, deflate, br',
'accept-language': 'zh-CN,zh;q=0.9',
'cache-control': 'no-cache',
'content-length': '278',
'content-type': 'application/json',
'cookie': '__utma=1.1986366783.1601607319.1601607319.1601607319.1; __utmz=1.1601607319.1.1.utmcsr=(direct)|utmccn=(direct)|utmcmd=(none); _RSG=blqD1d4mGX0BA_amPD3t29; _RDG=286710759c35f221c000cbec6169743cac; _RGUID=0850c049-c137-4be5-90b7-0cd67093f28b; MKT_CKID=1601607321903.rzptk.lbzh; _ga=GA1.2.1986366783.1601607319; nfes_isSupportWebP=1; appFloatCnt=8; _gcl_dc=GCL.1601638857.CKzg58XqlewCFQITvAodioIJWw; Session=SmartLinkCode=U155952&SmartLinkKeyWord=&SmartLinkQuary=&SmartLinkHost=&SmartLinkLanguage=zh; Union=OUID=index&AllianceID=4897&SID=155952&SourceID=&createtime=1602506741&Expires=1603111540922; MKT_OrderClick=ASID=4897155952&AID=4897&CSID=155952&OUID=index&CT=1602506740926&CURL=https%3A%2F%2Fwww.ctrip.com%2F%3Fsid%3D155952%26allianceid%3D4897%26ouid%3Dindex&VAL={"pc_vid":"1601607319353.3cid9z"}; MKT_Pagesource=PC; _RF1=218.58.59.72; _bfa=1.1601607319353.3cid9z.1.1602506738089.1602680023977.4.25; _bfi=p1%3D290510%26p2%3D290510%26v1%3D25%26v2%3D24; MKT_CKID_LMT=1602680029515; __zpspc=9.5.1602680029.1602680029.1%232%7Cwww.baidu.com%7C%7C%7C%25E6%2590%25BA%25E7%25A8%258B%7C%23; _gid=GA1.2.1363667416.1602680030; _jzqco=%7C%7C%7C%7C1602680029668%7C1.672451398.1601607321899.1602506755440.1602680029526.1602506755440.1602680029526.undefined.0.0.16.16',
'cookieorigin': 'https://you.ctrip.com',
'origin': 'https://you.ctrip.com',
'pragma': 'no-cache',
'referer': 'https://you.ctrip.com/',
'sec-fetch-dest': 'empty',
'sec-fetch-mode': 'cors',
'sec-fetch-site': 'same-site',
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/85.0.4183.121 Safari/537.36'
}

dat = {
    
    
    "arg": {
    
    
        'channelType': 2,
        'collapseType': 0,
        'commentTagId': 0,
        'pageIndex': 1,
        'pageSize': 10,
        'poiId': 75648,
        'sortType': 3,
        'sourceType': 1,
        'starType': 0
    },
    "head": {
    
    
        'auth': "",
        'cid': "09031117213661657011",
        'ctok': "",
        'cver': "1.0",
        'extension': [],
        'lang': "01",
        'sid': "8888",
        'syscode': "09",
        'xsid': ""
    }
}

r = requests.post(url, data=json.dumps(dat), headers=header)
s = r.json()
print(s)

Ejecutar resultado:
Inserte la descripción de la imagen aquíluego haga clic con el botón derecho en el resultado y luego haga clic en Mostrar como JSON:
Inserte la descripción de la imagen aquífinalmente, aparecerá la información de respuesta de la URL de destino y podrá comenzar a rastrear. ! !

Supongo que te gusta

Origin blog.csdn.net/gjgfjgy/article/details/109437381
Recomendado
Clasificación