--- --- 내용이 시작 복원
콘텐츠를 크롤링이 문서 크롤링 Jingdong 사이트 관련 상품 상점 이름, 제품 이름, 가격, 크롤링 자동으로 검색 할 키워드를 입력 (100) (총 100)
다음과 같이 코드입니다;
수입 요청을 가져올 재 # 请求头 헤더 = { ' 사용자 에이전트 ' : ' 모질라 / 5.0 (윈도우 NT 6.1; WOW64) AppleWebKit / 537.36 (KHTML, 도마뱀 붙이 등) 크롬 / 65.0.3325.181 사파리 / 537.36 ' } 데프 get_all (URL ), 키 에 대한 페이지 의 범위 (1,200,2 ) PARAMS = { ' 키워드 ' : 키 ' ENC ' : ' UTF-8 ' , ' 페이지 ': 페이지 } NUM = INT ((INT (페이지) +1) / 2 ) 시도 : 응답 = requests.get (URL = URL, PARAMS = PARAMS, 헤더 = 헤더) # 转码 내용 = response.text.encode (응답 .encoding) .decode (response.apparent_encoding) data_all = re.findall ( ' <div 클래스 = "P-가격">. * <? 나는> (. *?) </ 난>. *? <div 클래스 = " P-이름 P-이름 형-2 ">. *? 제목 ="(. *?) " ' ' . *? <DIV 클래스 ="P-가게 ". *? 제목 ="(. *?) " ' , 내용, 다시. S) 에 대한 I 에서 data_all : 오픈과 (열쇠+ ' .TXT ' , ' A + ' , 인코딩 = " UTF-8. ' ) F AS : f.write ( ' 상점 이름 : ' + I [2] + ' \ N- ' + ' 상품명 : ' . + I [1 ] + ' \ N- ' + ' 등급 : ' + I [0] + ' \ N- \ N- ' ) 전단 ( ' 제 ' + STR (NUM) + ' P ' + ' 데이터 다운로드 ....') 을 제외한 E AS 예외 : 인쇄 (E) 경우 __name__ == ' __main__ ' : 인쇄 ( ' 검색 할 내용, Jingdong 몰은 제품 이름, 상점 이름, 상품 가격 내부로 들어가 ' ) 키 =의 INPUT은 ( ' 검색어를 입력 : ' ) URL = ' ? https://search.jd.com/Search ' get_all (URL, 키)
실행 .EXE 파일로 패키지.
당신은 패키지 핍 다운로드 pyInstaller 중에 사용할 필요가;
pyInstaller 중에 설치 PIP
프로그램에 온라인 질환자 아이콘을 만들 때 그림 같은 폴더에 프로그램 아이콘,
포장 명령을 실행합니다 평 파일 디렉토리에서 명령 줄 창을여십시오;
E : \ 연습> 0808 \ JD1 \ 최종 단계 \ pyInstaller 중에 -F -i 01.ico jd.py
--- 끝 --- 복원 내용
콘텐츠를 크롤링이 문서 크롤링 Jingdong 사이트 관련 상품 상점 이름, 제품 이름, 가격, 크롤링 자동으로 검색 할 키워드를 입력 (100) (총 100)
다음과 같이 코드입니다;
수입 요청을 가져올 재 # 请求头 헤더 = { ' 사용자 에이전트 ' : ' 모질라 / 5.0 (윈도우 NT 6.1; WOW64) AppleWebKit / 537.36 (KHTML, 도마뱀 붙이 등) 크롬 / 65.0.3325.181 사파리 / 537.36 ' } 데프 get_all (URL ), 키 에 대한 페이지 의 범위 (1,200,2 ) PARAMS = { ' 키워드 ' : 키 ' ENC ' : ' UTF-8 ' , ' 페이지 ': 페이지 } NUM = INT ((INT (페이지) +1) / 2 ) 시도 : 응답 = requests.get (URL = URL, PARAMS = PARAMS, 헤더 = 헤더) # 转码 내용 = response.text.encode (응답 .encoding) .decode (response.apparent_encoding) data_all = re.findall ( ' <div 클래스 = "P-가격">. * <? 나는> (. *?) </ 난>. *? <div 클래스 = " P-이름 P-이름 형-2 ">. *? 제목 ="(. *?) " ' ' . *? <DIV 클래스 ="P-가게 ". *? 제목 ="(. *?) " ' , 내용, 다시. S) 에 대한 I 에서 data_all : 오픈과 (열쇠+ ' .TXT ' , ' A + ' , 인코딩 = " UTF-8. ' ) F AS : f.write ( ' 상점 이름 : ' + I [2] + ' \ N- ' + ' 상품명 : ' . + I [1 ] + ' \ N- ' + ' 등급 : ' + I [0] + ' \ N- \ N- ' ) 전단 ( ' 제 ' + STR (NUM) + ' P ' + ' 데이터 다운로드 ....') 을 제외한 E AS 예외 : 인쇄 (E) 경우 __name__ == ' __main__ ' : 인쇄 ( ' 검색 할 내용, Jingdong 몰은 제품 이름, 상점 이름, 상품 가격 내부로 들어가 ' ) 키 =의 INPUT은 ( ' 검색어를 입력 : ' ) URL = ' ? https://search.jd.com/Search ' get_all (URL, 키)
실행 .EXE 파일로 패키지.
당신은 패키지 핍 다운로드 pyInstaller 중에 사용할 필요가;
pyInstaller 중에 설치 PIP
프로그램에 온라인 질환자 아이콘을 만들 때 그림 같은 폴더에 프로그램 아이콘,
포장 명령을 실행합니다 평 파일 디렉토리에서 명령 줄 창을여십시오;
E : \ 운동은 0808 \ 최종 단계 \ \ JD1> pyInstaller 중에 -F -i dog.ico jd.py
성공적으로 포장 된 성공을 나타내는 등장;
27,525 INFO : 건물의 EXE 에서 EXE-00.toc이 성공적으로 완료되었습니다.
폴더에 현재 폴더에서 DIST 실행 파일;
영업 실적;
여러 프로그램을 실행할 수 있습니다;
출력;
끝난.