정기 크롤링 Jingdong 상품 정보 및 .EXE 실행 프로그램에 패키지.

--- --- 내용이 시작 복원

 콘텐츠를 크롤링이 문서 크롤링 Jingdong 사이트 관련 상품 상점 이름, 제품 이름, 가격, 크롤링 자동으로 검색 할 키워드를 입력 (100) (총 100)

다음과 같이 코드입니다;

수입 요청을
 가져올 # 请求头 
헤더 = {
     ' 사용자 에이전트 ' : ' 모질라 / 5.0 (윈도우 NT 6.1; WOW64) AppleWebKit / 537.36 (KHTML, 도마뱀 붙이 등) 크롬 / 65.0.3325.181 사파리 / 537.36 ' 
} 

데프 get_all (URL ), 키
     에 대한 페이지  범위 (1,200,2 ) 
        PARAMS = {
             ' 키워드 ' : 키
             ' ENC ' : ' UTF-8 ' ,
             ' 페이지 ': 페이지 
        } 
        NUM = INT ((INT (페이지) +1) / 2 )
         시도 : 
            응답 = requests.get (URL = URL, PARAMS = PARAMS, 헤더 = 헤더)
             # 转码 
            내용 = response.text.encode (응답 .encoding) .decode (response.apparent_encoding) 
            data_all = re.findall ( ' <div 클래스 = "P-가격">. * <? 나는> (. *?) </ 난>. *? <div 클래스 = " P-이름 P-이름 형-2 ">. *? 제목 ="(. *?) " ' 
                                  ' . *? <DIV 클래스 ="P-가게 ". *? 제목 ="(. *?) " ' , 내용, 다시.
            S) 에 대한 I 에서 data_all : 
                오픈과 (열쇠+ ' .TXT ' , ' A + ' , 인코딩 = " UTF-8. ' ) F AS : 
                    f.write ( ' 상점 이름 : ' + I [2] + ' \ N- ' + ' 상품명 : ' . + I [1 ] + ' \ N- ' + ' 등급 : ' + I [0] + ' \ N- \ N- ' )
                 전단 ( ' ' + STR (NUM) + ' P ' + ' 데이터 다운로드 ....')
         을 제외한 E AS 예외 :
             인쇄 (E) 


경우  __name__ == ' __main__ ' :
     인쇄 ( ' 검색 할 내용, Jingdong 몰은 제품 이름, 상점 이름, 상품 가격 내부로 들어가 ' )  =의 INPUT은 ( ' 검색어를 입력 : ' ) 
    URL = ' ? https://search.jd.com/Search ' 
    get_all (URL, 키)

실행 .EXE 파일로 패키지.

당신은 패키지 핍 다운로드 pyInstaller 중에 사용할 필요가;

pyInstaller 중에 설치 PIP

프로그램에 온라인 질환자 아이콘을 만들 때 그림 같은 폴더에 프로그램 아이콘,

 

 

포장 명령을 실행합니다 평 파일 디렉토리에서 명령 줄 창을여십시오;

E : \ 연습> 0808 \ JD1 \ 최종 단계 \ pyInstaller 중에 -F -i 01.ico jd.py

 

 

--- 끝 --- 복원 내용

 콘텐츠를 크롤링이 문서 크롤링 Jingdong 사이트 관련 상품 상점 이름, 제품 이름, 가격, 크롤링 자동으로 검색 할 키워드를 입력 (100) (총 100)

다음과 같이 코드입니다;

수입 요청을
 가져올 # 请求头 
헤더 = {
     ' 사용자 에이전트 ' : ' 모질라 / 5.0 (윈도우 NT 6.1; WOW64) AppleWebKit / 537.36 (KHTML, 도마뱀 붙이 등) 크롬 / 65.0.3325.181 사파리 / 537.36 ' 
} 

데프 get_all (URL ), 키
     에 대한 페이지  범위 (1,200,2 ) 
        PARAMS = {
             ' 키워드 ' : 키
             ' ENC ' : ' UTF-8 ' ,
             ' 페이지 ': 페이지 
        } 
        NUM = INT ((INT (페이지) +1) / 2 )
         시도 : 
            응답 = requests.get (URL = URL, PARAMS = PARAMS, 헤더 = 헤더)
             # 转码 
            내용 = response.text.encode (응답 .encoding) .decode (response.apparent_encoding) 
            data_all = re.findall ( ' <div 클래스 = "P-가격">. * <? 나는> (. *?) </ 난>. *? <div 클래스 = " P-이름 P-이름 형-2 ">. *? 제목 ="(. *?) " ' 
                                  ' . *? <DIV 클래스 ="P-가게 ". *? 제목 ="(. *?) " ' , 내용, 다시.
            S) 에 대한 I 에서 data_all : 
                오픈과 (열쇠+ ' .TXT ' , ' A + ' , 인코딩 = " UTF-8. ' ) F AS : 
                    f.write ( ' 상점 이름 : ' + I [2] + ' \ N- ' + ' 상품명 : ' . + I [1 ] + ' \ N- ' + ' 등급 : ' + I [0] + ' \ N- \ N- ' )
                 전단 ( ' ' + STR (NUM) + ' P ' + ' 데이터 다운로드 ....')
         을 제외한 E AS 예외 :
             인쇄 (E) 


경우  __name__ == ' __main__ ' :
     인쇄 ( ' 검색 할 내용, Jingdong 몰은 제품 이름, 상점 이름, 상품 가격 내부로 들어가 ' )  =의 INPUT은 ( ' 검색어를 입력 : ' ) 
    URL = ' ? https://search.jd.com/Search ' 
    get_all (URL, 키)

실행 .EXE 파일로 패키지.

당신은 패키지 핍 다운로드 pyInstaller 중에 사용할 필요가;

pyInstaller 중에 설치 PIP

프로그램에 온라인 질환자 아이콘을 만들 때 그림 같은 폴더에 프로그램 아이콘,

 

 

 

 

포장 명령을 실행합니다 평 파일 디렉토리에서 명령 줄 창을여십시오;

E : \ 운동은 0808 \ 최종 단계 \ \ JD1> pyInstaller 중에 -F -i dog.ico jd.py

성공적으로 포장 된 성공을 나타내는 등장;

27,525 INFO : 건물의 EXE 에서 EXE-00.toc이 성공적으로 완료되었습니다.

폴더에 현재 폴더에서 DIST 실행 파일;

영업 실적;

여러 프로그램을 실행할 수 있습니다;

출력;

끝난.

 

추천

출처www.cnblogs.com/nmsghgnv/p/11324959.html