分享原创python爬取微信公众号,并分享GITHUB地址

爬取搜狗微信保存mysql
创建人:紫气东来
因为工作中用到抓取微信与内外部网站进行同步,所以编写了此程序。
程序思路:用selenium模拟手机登陆,下载对应HTML,再用BeautifulSoup解析html,存放mysql
程序构建在py3.x基础上,可以优化为爬虫程序。



代码地址:https://github.com/xocom/readwx

一:使用说明
1:程序使用了selenium,所以必须先安装chrome浏览器对应插件。
  插件下载地址:https://sites.google.com/a/chromium.org/chromedriver/downloads
  下载对应版本的EXE文件后,拷贝到chrome浏览器的目录,比如:C:\Program Files (x86)\Google\Chrome\Application
  V56-V57版本的chrome可以直接用plugin下的chromedriver

2:建立表结构之后,修改运行test.py,数据会抓取到对应表。



猜你喜欢

转载自blog.csdn.net/xocom/article/details/72772107
今日推荐