待更新:
建立python开发虚拟环境 virtualenv mkvirtualenv --python=the-path-to-the-python-you-want-to use
安装:
使用pip install scrapy就可以了,然后自动安装成功
新建scapy项目:
进入需要新建项目的路径
然后 进入虚拟环境 workon virtualenv-name或者进入到虚拟环境下的目录,然后用activate
然后 scrapy startproject project-name 就可以了
然后用pycharm打开该项目,这个时候scrapy项目是空的
进入到项目文件夹下
然后 scarpy genspider name url
进入pycharm右键同步
可以为该项目添加虚拟环境的解释器,到时候可以一起打包(待验证)
sys.path.append() os.path.dirname() os.path.abspath(__file__)
from scrapy.cmdline import execute execute(['scrapy','crawl','name'])
设置settings.py里面的24行 ROBOTSTXT_OBEY = FALSE
基本的调试,断点,
xpath的基本语法
从chrome审查中直接获取节点的xpath路径,右键即可,可以点击审查的元素找页面中的元素,也可以反着来
终端调试: scrapy shell url
ipython 安装 pip install ipython
出现了问题,就卸载再装吧(反正成功了,但是还是不知道问题在哪,无语)