Python爬虫入门实例一之淘宝商品页面的爬取 - 代码天地

Python爬虫入门实例一之淘宝商品页面的爬取

其他 2020-10-30 12:25:33 阅读次数: 0

文章目录

1.爬取原界面

今天给大家介绍第一个爬虫小例子，使用requests库爬取淘宝商品信息，首先想要爬取的内容如下图。
在这里插入图片描述

2.代码解析

使用交互环境给大家带来代码解析

（1）首相导入requests库，然后将网页url地址保存到变量中

在这里插入图片描述
（2）使用requests库的get()方法得到地址，并用r.raise_for_status函数判断是否连接正常，正常则返回200，其他值则为错误

在这里插入图片描述
（3）将从网页内容中解析出的编码方式赋值给r.encoding，之后以字符串的方式将爬取内容输出

在这里插入图片描述
（4）输出内容如下

在这里插入图片描述

3.完整代码

import requests
url = "https://item.taobao.com/item.htm?id=625588903252&ali_refid=a3_430673_1006:1123185872:N:5Li%2BA5zGU7Aqz5docyZENQ%3D%3D:6620fa14ff820a1fe33c8d19bbbd1752&ali_trackid=1_6620fa14ff820a1fe33c8d19bbbd1752&spm=a2e15.8261149.07626516002.2"
try:
    r = requests.get(url)
    r.raise_for_status()
    r.encoding = r.apparent_encoding
    print(r.text)
except:
    print("爬取失败")

所有编程实践中，代码最终的效果固然很重要，但更重要的还是代码的稳定性，所以使用try except代码块捕获异常

本篇完，如有错误欢迎指出~

扫描二维码关注公众号，回复： 12083226 查看本文章

引用源自

中国大学MOOC Python网络爬虫与信息提取
https://www.icourse163.org/course/BIT-1001870001

猜你喜欢

转载自blog.csdn.net/weixin_44578172/article/details/109301305

Python爬虫入门实例一之淘宝商品页面的爬取

Python爬虫入门实例二之亚马逊商品页面的爬取

Python爬虫入门实例五之淘宝商品信息定向爬取(优化版)

Python爬虫之Requests库——亚马逊商品页面的爬取

爬虫系列之淘宝商品爬取

python爬虫爬取淘宝商品的销量

python爬取淘宝商品页面信息

Python爬虫实例之淘宝商品比价定向爬取！爬虫还是很有意思的！

python爬取淘宝商品比价实例（对re库的使用，淘宝反爬虫机制的解决）

网络爬虫爬取淘宝商品页面数据

python爬虫爬取淘宝搜索页面商品信息数据

网络爬虫-京东商品页面的爬取

requests实例1：京东商品页面的爬取

python爬虫 — 爬取淘宝商品信息

python爬虫爬取淘宝网商品信息

Python爬虫爬取淘宝，京东商品信息

python 爬取淘宝商品

python爬虫之requests库传递cookies(爬取2019淘宝网商品列表)

Python爬虫之淘宝数据爬取（商品名称，价格，图片，销量）

爬虫爬取淘宝商品信息

python爬虫爬取淘宝商品比价（附淘宝反爬虫机制解决小办法）

python学习之爬取淘宝商品信息

python面向对象多线程爬虫爬取搜狐页面的实例代码

Python Requests库入门——应用实例-京东商品页面爬取

Python网络爬虫之爬取淘宝网页页面 MOOC可以运行的代码

Python爬虫实例，一小时上手爬取淘宝评论(附代码)！

python爬虫实例，一小时上手爬取淘宝评论（附代码）

Python爬取淘宝商品失败---解决：淘宝的反爬虫机制 - http重定向问题

Python爬虫（入门+进阶）学习笔记 1-8 使用自动化神器Selenium爬取动态网页（案例三：爬取淘宝商品）

爬取千万淘宝商品的python脚本

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)