小白学Python ——day12

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/zhaoluwei/article/details/86526963

老师授课内容:

day12-实训12

1、选择器
    标签选择器
    类选择器
    id选择器
        每一个标签都可以添加一个id属性,id的值在整个html文件中必须是唯一的
    层级选择器
        就是一级一级的找下去
        选择器1 选择器2 选择器3 选择器4
        空格:后面的是前面的子节点或者子孙节点都可以
        > : 后面的必须是前面的子节点
2、爬虫原理
    什么是爬虫?现在的时代是一个数据的时代,data,通过分析数据来得到用户的习惯,再来优化自己的产品。
    数据从哪获取呢?
    (1)买,有专门卖数据的公司,华住集团数据泄露了
    (2)爬取数据,互联网上很多数据,爬虫工程师
    爬取数据的代码就称之为爬虫程序
    如何爬取数据?
        上网的原理
    代码如何发送请求?
    反爬第一步
        伪装浏览器
3、bs4学习
    解析网页。bs4是一个第三方的模块,需要安装才能使用
    pip install bs4 -i https://pypi.doubanio.com/simple
    语法学习
        见代码
4、解析案例

猜你喜欢

转载自blog.csdn.net/zhaoluwei/article/details/86526963