爬虫简单基础代码 - 代码天地

爬虫简单基础代码

其他 2018-04-28 20:57:55 阅读次数: 4

以下代码可以去掉注释单独运行：

 1 import urllib.request
 2 
 3 url = 'http://www.jianshu.com/'
 4 response = urllib.request.urlopen(url=url) #第一个参数是要打开的url 第二个是data表示post请求时 使用的 print(type(response))\
 5 #   #返回的是一个HTTPResponse对象
 6 # print(response.read())   #读取了所有网页的内容 包括换行符和制表符，获取的二进制数据
 7 # print(response.read().decode('utf-8')) #解码后进行输出  #字符串-》字节：编码  encode()  字节-》字符串：解码  decode()
 8 # print(response.readline())  #读取一行
 9 # print(response.readlines())  #读取全部返回一个列表
10 # print(response.getheaders())  #返回一个响应头信息，列表里面有元组
11 # urllib.request.urlretrieve(url=url,filename='baidu.html') #将文件下载到本地并命名，可以下载网页 图片 视频等
12 # urllib.parse #处理url的urllib.parse.urlencode 介绍post请求的时候再说这个函数
13 print(response.getheaders())
14 #编码:因为浏览器并不能识别你请求里面的中文字符
15 # 编码
16 # string = urllib.parse.quote('http://www.baidu.com?username=狗蛋&password=123')
17 # print(string)
18 #解码
19 # string = urllib.parse.unquote('http%3A//www.baidu.com%3Fusername%3D%E7%8B%97%E8%9B%8B%26password%3D123')
20 # print(string)

猜你喜欢

转载自www.cnblogs.com/creative-work/p/8969562.html

爬虫简单基础代码

爬虫，简单爬虫基础！

爬虫基础20%知识，开发简单爬虫

简单网络爬虫基础功能

python爬虫基础源代码

简单网站爬虫30行代码

python3简单爬虫代码

最简单的爬虫代码（Python3）

Python实现简单的爬虫代码以及步骤

一个简单的爬虫例子（代码）

python基础之简单爬虫实例

Python 开发简单爬虫 - 基础框架

爬虫基础知识简单案例

python爬虫之 JavaScript 简单基础

基础爬虫------三个简单爬虫案例(很funny)

Python爬虫基础：简单的爬虫入门示例（urllib库）

python3简单爬虫环境配置+爬虫源代码（让小白也能玩好爬虫）

大数据python之简单的网络爬虫代码实现（单一与循环代码进行网络爬虫）

爬虫简易入门代码-爬取简单网页图片

一次简单Python爬虫代码记录

java编写的一段简单的爬虫demo代码

Python——网络爬虫，一个简单的通用代码框架

python系列整理---爬虫架构简单代码实现

简单的爬虫

简单爬虫

爬虫基础---简单使用（附带豆瓣电影top250）

JDBC基础操作与简单代码优化

android最最基础简单的保存xml代码

简单的实战演练：维基百科爬虫（附带爬虫样例代码）

爬虫基础实战二（封装抓取网页代码）

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)