En mi tiempo libre, escribí una interfaz Java que utiliza httpClient y Jsoup para obtener información del producto JD y luego la almacena en la base de datos.
Se descubrió un problema en el medio, utilizamos la api httpclient para obtener información a través de la URL de JD.com:
//获取HttpClient对象 CloseableHttpClient httpClient = HttpClients.custom().setConnectionManager(cm).build(); //声明httpGet请求对象 HttpGet httpGet = new HttpGet(url);
Resultados de devolución:
<script>window.location.href=' https://passport.jd.com/uc/login '</script>
Esto significa que debe ir a la página de inicio de sesión de JD para iniciar sesión. La solución:
Establecer la información del encabezado: entorno de simulación
httpGet.setHeader("User-Agent","Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:62.0) Gecko/20100101 Firefox/62.0");