Day1：笔记 - 代码天地

Day1：笔记

其他 2019-07-02 13:31:30 阅读次数: 0


一.爬虫基本原理
1.什么是爬虫？
爬虫就是爬取数据

2.什么是互联网？
由一堆网络设备，把一台台的计算机互联到一起称之为互联网

3.互联网建立的目的？
数据的传递与数据的共享

4.什么是数据？
例如：电商平台的商品信息（淘宝、京东、亚马逊）、链家、
自如租房平台（房源信息）、股票证券投资信息（东方财富、雪球网）、12306（票务信息）、

5.什么是上网？
普通用户：
打开浏览器---->输入网址
          ---->往目标主机发送请求
          ---->返回响应数据
          ---->把数据渲染到浏览器中

爬虫程序：
模拟浏览器---->往目标主机发送请求
         ----->返回响应数据
         ----->解析并提取有价值的数据
         ----->保存数据（文件写入本地，持久化数据库）

6.爬虫的全过程
①发送请求（请求库：Requests/Selenium）
②获取响应数据
③解析数据（学习解析库：BeautifulSoup4）
④保存数据（存储库：文件保存/MongoDB）

总结：我们可以把互联网中的数据比喻成一座宝藏，爬虫其实就是挖取宝藏

二.requests请求库
1.安装与使用
   pip3 install requests

2.模拟浏览器（分析请求流程）
  百度：
  ①请求url
  ②请求方式（GET,POST）
  ③响应状态码

猜你喜欢

转载自www.cnblogs.com/Auraro997/p/11119971.html

day1 笔记

笔记day1

Day1：笔记

day1 课上笔记

day1学习笔记

day1 学习笔记

JavaScript笔记day1

java笔记 day1

jquery笔记day1

DAY1 预习笔记

day1中的笔记

python笔记1—day1

Python学习笔记——day1

[笔记] APIO 2018 Day1

Day1笔记

前端星计划笔记-day1

Day1 HTML入门笔记内容

android 自学笔记- day1

python学习笔记 day1

Laravel学习笔记Day1

CSS学习笔记_day1

web编程笔记-DAY1（html）

Python学习笔记-DAY1

机器学习笔记 Day1

JavaSctript原生学习笔记--Day1

HTML学习笔记day1

网络编程笔记-day1

网络爬虫笔记(Day1)

linux 学习笔记 day1

学习笔记day1 python的认识

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)