《从0到1学爬虫》

署名夜斗,从今天开始和我一起学习爬虫吧!

人是早上起的,卷子是上午做的,心是下雪时凉的,人是下午走的; 今天刚考完概率论,表示明年重修的钱出不起了!因为概率论难就能阻挡我啃代码的心嘛?不可能的,就从今天开始记录自己python爬虫的成长史吧 ~~~~夜斗小神社

在这里插入图片描述

一:为什么想学爬虫

这得从疫情期间说起,这段时间刚好是自己接触python的时候,在这之前自己只会一些C语言的基本知识,甚至连指针都是不大会的那种,两个字形容自己吧就是拉跨;正好遇到学校的一个数学建模校赛,那时候需要通过自己去网上爬取高考数据然后进行建模预测,恰好了解到python写爬虫是比较方便的,然后就去了众所周知的学习网址b站学了一点爬虫的知识,就把那个数据弄下来了,然后自己组队的小伙伴觉得这个人还可以哈,有点东西;但是之后因为某些原因就没有再继续去深入学习爬虫了,然后之前学的也差不多都忘干净了,因此想通过自己写博客来记录一下自己这位爬虫小白的奋斗史吧!
*~~~~ *

二: 爬虫到底能干嘛

现在自己对爬虫的印象就是:

  1. 通过写代码让其自己给我从我想要的网址上获得我想要的指定数据,比如说爬取淘宝店铺信息呐、比较出名的猫眼电影Top250;
  2. 参加某些数据分析比赛、数学建模比赛,能够通过自己代码实现数据爬取,这些数据是自己比赛能否完成自己作品的基石
  3. "爬虫学的好,局子进的早"指的是一些禁止爬虫爬取的网址,有一个rotbots协议吧, 不让你爬的千万别去爬,不然真会进局子的
  4. 爬虫最难的一点就是反爬了吧,什么js逆向、字体加密啥的都是比较难的事情,这些东西之后估计也够我这个小白吃几壶了吧

爬虫这门系列课之后怎么学

  • 其实我也没啥人教,纯小白一个,凭着爱好、兴趣吧,都是自学一些教程和一些大佬的文章吧,感谢那些出教学文章的大佬们!
  1. 爬取b站《守护解放西》弹幕: https://blog.csdn.net/xtreallydance/article/details/112399856
  2. python爬虫JS逆向咸鱼入门!
    https://blog.csdn.net/xtreallydance/article/details/112478372
  3. python爬取可爱女生图片
    https://blog.csdn.net/xtreallydance/article/details/112548069
  4. python自动化爬取淘宝商品数据导入execl表格
    https://editor.csdn.net/md/?articleId=112692551

猜你喜欢

转载自blog.csdn.net/xtreallydance/article/details/112324704