Python爬虫学习第一天--环境准备

1、更新pip 第三方安装库
python -m pip install --upgrade pip (有些情况需要管理员模式运行命令提示符窗口,不然可能会报错)

2、检查是否安装urllib re库
cmd-->python-->import urllib,re,request,selenium

cmd模式下
pip3 install requests #安装requests库,发起请求
pip3 install selenium #安装selenium库,驱动浏览器,用于自动化测试,执行JS渲染

下载chromedriver http://npm.taobao.org/mirrors/chromedriver/2.40/ 解压至E:\Program Files\Python36\Scripts

#测试selenium库的webdriver
  from selenium import webdriver
  browser = webdriver.Chrome()
  browser.get('http://www.baidu.com/')

下载phantomjs http://phantomjs.org/download.html 解压至E:\Program Files\Phantomjs-2.1.1\ 将E:\Program Files\Phantomjs-2.1.1\bin添加至环境变量

  from selenium import webdriver
  browser = webdriver.PhantomJS()
  browser.get('http://www.baidu.com/') #后台静态运行

pip3 isntall wheel
pip3 install lxml
pip3 install beautifulsoup4
  from bs4 import Beautifulsoup
  soup=Beautifulsoup('http://baidu.com')
  pip3 install pyquery#网页解析库

pip3 install pymysql
  import pymysql
  conne= pymysql.connect(host='localhost',user='root',password='yh984664',port=3306,db='mysql' )
  cursor=conne.cursor()
  cursor.execute('select * from db')
  cursor.fetchone()#验证mysql连接

pip3 install pymongo
  import pymongo
  client=pymongo.MongoClient('localhost')
  db=client['newdb']
  db['table'].insert(('name':'chenwei'))
  db['table'].find_one(('name':'chenwei'))##验证MongoDB连接

pip3 install redis#用于分布式爬虫
  import redis
  re=redis.Redis('localhost',6379)
  re.set('name','chenwei')
  re.get(name)

pip3 install flask#设置web服务器,增加代理
  pip3 install django
  pip3 install jupyter #网页版记事本

pycharm无法导入安装好的第三方模块
前提:电脑已经python36和pycharm,并且已经在python3.6的交互环境下安装好了bs4 模块
问题:在pycharm中导入bs4 模块时,显示找不到模块。但在python3.6的交互环境下,可以导入bs4模块。输入 from bs4 import BeautifulSoup 时,显示 ModuleNotFoundError: No module named 'BeautifulSoup'
原因:pycharm所使用的解释器并不是已经安装的python3.6,而是自带了python.exe解释器,并且只有两个模块pip和setuptools,这样一来,当然找不到bs4模块。(如图一,查看路径 File->settings->project:当前文件名->Project Interpreter)
解决措施:将pycharm的解释器设置为自己安装的python3.6

猜你喜欢

转载自www.cnblogs.com/chenxiaoweiworkinghard/p/9275840.html