爬虫开发web前端基础

1、HTTP/HTTPS:互联网上应用最为广泛的一种网络协议,目前所有网站开发都基于该协议,也是网站的实现原理
2、请求头:基于HTTP/HTTPS协议实现,其作用是在通信之间实现信息的传递,熟知各种请求类型,对爬虫中编写请求头有指导性作用
3、Cookies:存储在用户主机浏览器中的文本文件,主要让服务器识别各个用户身份信息
4、HTML:服务器返回的网页内容,一般由服务器后台生成,网站大部分数据来源于此,熟悉HTML布局和各个标签的作用,有利于数据抓取和清洗
5、JavaScript:主要实现网页的动态功能以后用户交互,要懂得分析JavaScript代码,尤其是数据加密处理
6、JSON:表示一个JavaScript对象的信息,本质是一个特殊的字符串
7、Ajax:主要是前端数据加载,其响应内容大部分是以json格式为主

猜你喜欢

转载自blog.csdn.net/weixin_37411471/article/details/89425899