scrapy 用法总结

待更新:

建立python开发虚拟环境 virtualenv  mkvirtualenv --python=the-path-to-the-python-you-want-to use 

安装:

使用pip install scrapy就可以了,然后自动安装成功

新建scapy项目:

进入需要新建项目的路径

然后 进入虚拟环境 workon virtualenv-name或者进入到虚拟环境下的目录,然后用activate

然后 scrapy startproject project-name 就可以了

然后用pycharm打开该项目,这个时候scrapy项目是空的

进入到项目文件夹下

然后 scarpy genspider name url

进入pycharm右键同步

可以为该项目添加虚拟环境的解释器,到时候可以一起打包(待验证)

sys.path.append()
os.path.dirname()
os.path.abspath(__file__)
from scrapy.cmdline import execute

execute(['scrapy','crawl','name'])

设置settings.py里面的24行 ROBOTSTXT_OBEY = FALSE

基本的调试,断点,

xpath的基本语法

从chrome审查中直接获取节点的xpath路径,右键即可,可以点击审查的元素找页面中的元素,也可以反着来

终端调试: scrapy shell url

ipython 安装 pip install ipython

出现了问题,就卸载再装吧(反正成功了,但是还是不知道问题在哪,无语)

猜你喜欢

转载自www.cnblogs.com/zdj8023/p/10878916.html