语言的学习最好是结合实践,在所有的实践中,爬虫算一个比较容易上手的,可以复习python 的语法,尤其是数据的操作,正则表达式,,函数,这些比较基础重要的知识点。
爬虫,通俗的来讲,就是我们按照一定的规则来自动提取 Internet上的目标信息。像百度,谷歌,360这种搜索引擎相当于一个大爬虫程序,在网络里爬取我们搜索的信息相关的网页。我们的爬虫,就是写出程序达到类似搜索引擎干的事情。
爬虫入门只必备知识点
HTTP: 超文本传输协议(Hyper Text Transfer Protocol)
看中文可能不懂,看英文,Text Transfer,大概就是一种文本信息的传输 。光HTTP的知识就可以写一本书,可以参考《HTTP原理》,《图解HTTP》等。这里只需要知道http的作用方式就像打电话。打电话的人相当于客户端,接电话的相当于服务端,中间的信息处理就是HTTP。
细心留意,会发现有个HTTPS(Hyper Text Transfer Protocol over Secure Socket Layer)多的那几个单词的意思就是加密的意思,就是相当于你打电话的过程以某种规则或协议加密了
Ideas worth spreading----》》
If the song of your heart ceases to play, can you survive in the silence?