版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/zhaoluwei/article/details/86526963
老师授课内容:
day12-实训12
1、选择器
标签选择器
类选择器
id选择器
每一个标签都可以添加一个id属性,id的值在整个html文件中必须是唯一的
层级选择器
就是一级一级的找下去
选择器1 选择器2 选择器3 选择器4
空格:后面的是前面的子节点或者子孙节点都可以
> : 后面的必须是前面的子节点
2、爬虫原理
什么是爬虫?现在的时代是一个数据的时代,data,通过分析数据来得到用户的习惯,再来优化自己的产品。
数据从哪获取呢?
(1)买,有专门卖数据的公司,华住集团数据泄露了
(2)爬取数据,互联网上很多数据,爬虫工程师
爬取数据的代码就称之为爬虫程序
如何爬取数据?
上网的原理
代码如何发送请求?
反爬第一步
伪装浏览器
3、bs4学习
解析网页。bs4是一个第三方的模块,需要安装才能使用
pip install bs4 -i https://pypi.doubanio.com/simple
语法学习
见代码
4、解析案例