网络爬虫入门(1)

        语言的学习最好是结合实践,在所有的实践中,爬虫算一个比较容易上手的,可以复习python 的语法,尤其是数据的操作,正则表达式,,函数,这些比较基础重要的知识点。

        爬虫,通俗的来讲,就是我们按照一定的规则来自动提取 Internet上的目标信息。像百度,谷歌,360这种搜索引擎相当于一个大爬虫程序,在网络里爬取我们搜索的信息相关的网页。我们的爬虫,就是写出程序达到类似搜索引擎干的事情。

爬虫入门只必备知识点

HTTP:   超文本传输协议(Hyper Text Transfer Protocol)

看中文可能不懂,看英文,Text  Transfer,大概就是一种文本信息的传输 。光HTTP的知识就可以写一本书,可以参考《HTTP原理》,《图解HTTP》等。这里只需要知道http的作用方式就像打电话。打电话的人相当于客户端,接电话的相当于服务端,中间的信息处理就是HTTP。

细心留意,会发现有个HTTPS(Hyper Text Transfer Protocol over Secure Socket Layer)多的那几个单词的意思就是加密的意思,就是相当于你打电话的过程以某种规则或协议加密了


Ideas worth spreading----》》

                     If  the song of your heart ceases to play, can you survive in the silence?



猜你喜欢

转载自blog.csdn.net/jobbaba/article/details/80947456