第二关

第二关网址: http://www.heibanke.com/lesson/crawler_ex01

第二关就是去登陆，用户名是任意的，密码是0到30中的一个数字，我们一个个试过去就行

步骤

构造请求参数
然后密码从0到30去尝试登陆

代码

#!usr/bin/env python3
# -*- coding: utf-8 -*-

import requests
import re

#定义一个登陆类
class Login(object):

    def __init__(self):
        #设置会话对象，命名为session，Session()的作用就相当于在同一个浏览器里进行访问
        #可以跨请求保持cookies，不需要再单独为每个请求设置cookie
        self.session = requests.Session()
        #设置请求头
        self.headers = {
            'Host': 'www.heibanke.com',
            'User-Agent': 'Mozilla/5.0 (iPad; CPU OS 12_0 like Mac OS X) AppleWebKit/604.1.34 (KHTML, like Gecko) CriOS/68.0.3440.83 Mobile/16A5345f Safari/604.1',
            'Accept-Language': 'zh-cn',
            'Accept-Encoding': 'gzip, deflate',
            'Connection': 'keep-alive'
        }
        #设置get和post请求的url
        self.url = 'http://www.heibanke.com/lesson/crawler_ex01/'
        #设置post请求需要提交的数据，'username'和'password'两个参数是必要的，'csf'为空也可以登陆
        self.data = {
            'csrfmiddlewaretoken' : '',
            'username' : 'user',
            'password' : ''
        }

    #可以把get_cookies()方法去掉，因为经过测试，即使post的时候，cfs为空也可以进行登陆
    #这里留着是强迫症
    #得到csf
    def get_cookies(self):
        response = self.session.get(url=self.url, headers=self.headers)
        print(response.cookies)
        #取出cookie，可以打印response.cooikes看看里面是什么内容
        self.data['csrfmiddlewaretoken'] = response.cookies['csrftoken']

    #进行post登陆
    def post_page(self): 
        response = self.session.post(url=self.url, headers=self.headers, data=self.data)
        #用re，把页面的内容提取出来，方便我们在登陆过程中查看登陆的状态
        text = re.findall('<h3>(.*?)</h3>', response.text, re.S)[0]
        print ('用户名:', self.data['username'],'----密码: ',self.data['password'],'---csf:',self.data['csrfmiddlewaretoken'],'提示信息:',text)
        return text
    def login(self):
        self.get_cookies()
        #从0到30，给'password'设值
        for x in range(31):
            self.data['password'] = str(x)
            text = self.post_page()
            #假如闯关成功，页面就会有成功两个字
            if '成功' in text:
                print('你成功的闯关了！密码是：', x)
                break

if __name__ == "__main__":
    login = Login()
    login.login()

结语：

源码: 点我

欢迎关注我的公众号 疯子的Python笔记

公众号二维码.jpg

Python爬虫闯关-2

第二关

步骤

代码

结语：

猜你喜欢