哈哈,不知到这篇文章会不会封,下面我来讲解一下如果用scrapy和Selenim强势模拟登录CSDN网站。
现如今我们能够叫出来名的网站对反爬虫做的很是到位,如知乎,知乎以前快被爬虫玩废了,现在知乎的登录做的很是复杂,一般人时模拟登陆不成功的,好在我们有selenium,这个东西是神器,基本上任何网站都能够破解,下面我来讲解一下如何攻破老东家csdn。
首先起要确保你的电脑上安装了scrapy 和 selenium ,如果没安装,请自行搜索下载安装,这里我就不说安装的步骤了,因为这东西网上都有的。
好开始撸代码:
其实原理很简单,就是通过模拟登录获得cookie,然后通过cookie进行登录。
第一步,就是先在cmd 中输入scrapy startproject AutoLogin 创建一个scrapy 模板
第二步,在cmd中输入 scrapy genspider csdn csdn.net 创建一个csdn.py
第三步,在csdn.py里面写代码
代码如上图所示
哈哈,我就不讲解了,其实很简单,相信大家的聪明才智肯定可以领悟的,如果有问题的话,在下方评论哦。
拜拜