（爬虫）Python爬虫01 - 代码天地

（爬虫）Python爬虫01

其他 2020-03-08 22:01:20 阅读次数: 0

目录：

一、基本知识介绍

二、获取网页

一、基本知识介绍

1、主要依赖 urllib：即URL（网页地址）+lib（包）；详细解释请参考python文档（打开IDLE -- Help -- Python Docs -- 查询即可）；

2、URL的一般格式（ps： [] 内可省略）

协议 :// 域名 [ :端口 ] / 路径 /

其中的名词解释如下：

协议：如：http，https，ftp，file 等；

域名：存放资源的服务器域名系统或者IP地址（部分需要加端口号，如：8080），如：www.baidu.com（域名例子），localhost（本机IP地址）等；

路径：存放资源的具体地址，目录或者文件名等，如：index.html等。

二、获取网页

#引入依赖
import urllib.request
#打开博客园登录地址(即获取该页面)，将返回的对象存入response中                                                      
response = urllib.request.urlopen("https://account.cnblogs.com/signin")    
#读出刚才返回的对象,将以二进制字符串形式存入html_d中
html_d = response.read() 
#将二进制字符串以 utf-8 解码(主要看页面是用什么编码的，但通常都是 utf-8 )                                                  
html = html_d.decode("utf-8") 
#将结果打印出来                                            
print(html)

View Code

本博客参考：

零基础入门学习Python https://www.bilibili.com/video/av4050443?p=54

猜你喜欢

转载自www.cnblogs.com/hwh000/p/12445199.html

（爬虫）Python爬虫01

【Python爬虫】01

Python 爬虫01

python爬虫学习01

python爬虫Day 01

【python】——爬虫01 概述

Python爬虫基础01

Python爬虫教程-01-爬虫介绍

【Python爬虫】01_爬虫简介

python爬虫精选01集（初识爬虫）

Python（爬虫时代）——爬虫开发01

python之爬虫的入门01------爬虫原理、爬虫伪装

python爬虫 day01

python 爬虫（01）发起请求

python爬虫--01 requests库

01 python爬虫环境准备

Python 爬虫入门实战01

[爬虫01]爬虫基础

爬虫01

爬虫-01

Python爬虫 -- 喜马拉雅爬虫01

Python学习之网络爬虫01--网络爬虫的定义

Python与爬虫入门实践——简易搜狐新闻爬虫01

01 Python 网络爬虫：爬虫技术的核心原理

python 爬虫系列01 认识 uillib

【01】Python爬虫：基本原理

python 基础网络爬虫 day01

PYTHON 基础01-爬虫初探

python网络爬虫基础day01

python爬虫学习之requests_01

今日推荐

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

虽然老乡鸡开源的不是代码，但背后的原因却让人很暖心

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

周排行

SVN同步出现问题

解决 nginx 出现 413 Request Entity Too Large 的问题

第一节区块链服务BaaS的总体架构以及基本模块设计的一种方案

ITeye 2013年度盘点——社区赠书书单

IDEA / git 和github 的新手使用教程史上最简单的 IntelliJ IDEA 教程史上最简单的 GitHub 教程

测试工程方法：测试用例设计综合策略

Spark优化(三)：对多次使用的RDD进行持久化

使用STM32 ST-LINK Utility 设置读保护后不能运行

exgcd 解同余方程ax=b(%n)

Android使用脚本进行多渠道打包

每日归档

更多

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)

2024-04-13(119)