爬取商品信息、写入数据库操作 - 代码天地

爬取商品信息、写入数据库操作

其他 2019-05-19 01:31:25 阅读次数: 0

爬取商品信息并写入数据库操作

　　本次爬取当当网图书程序设计类书籍，爬取信息包括书名、链接和评论，并写入mysql。

1、首先修改items.py

　　title存储书名、link存储商品链接、comment存储评论数

2、其次修改dd.py

　　首先要用xpath提取商品的信息，其次还需要构造程序设计类书籍每一页的链接。通过分析网页的组成，构造下一页的网页来提取更多的商品信息，如上图循环url所示。

　　需要提取上图三个红框中的内容，就需要设置xpath提取式。第一个红框是书名，设置xpath为：‘//a[@class="pic"]/@title’，‘//a’表示在所有的a标签下，但是在a标签下有很多内容，提取到我们需要的内容就需要设置相应的表达式，此时发现当搜索‘class="pic"’这个条件时，可以检索出60个关键词，而刚好每一页都有60个商品，那么我们可以通过设置满足‘class="pic"’，来提取所有的书名。同理，可以得出商品链接和评论数的xpath。

3、设置pipelines.py

　　在mysql中新建了一个名叫dd的数据库，表名为goods，表中tile、link和comment都设置为char类型。通过import pymysql连接数据库，将爬取到的数据写入到数据库中。通过mysql的操作查看爬取到的内容：

　　

猜你喜欢

转载自www.cnblogs.com/whliscoming/p/10878580.html

爬取商品信息、写入数据库操作

requests和re库爬取淘宝商品信息

使用正则库爬取淘宝商品信息

Python爬虫实战Scrapy抓取商品信息并写入数据库

java京东商品信息爬取

爬虫爬取淘宝商品信息

爬取京东商品信息

Python爬取淘宝商品信息

爬取淘宝商品信息

爬取京东商城商品信息

爬取某东商品信息

【数据库】商品信息表的设计

创建Supermarket数据库并查询商品信息

Python网络爬虫与信息提取（7）—— 用re库爬取淘宝商品信息

几行代码爬取某东商品评论并写入数据库做成词云

day03(爬取京东商品信息、解析库)

Python selenium库爬取淘宝网商品信息

利用Python爬取淘宝商品信息并进行数据可视化

python爬虫爬取淘宝搜索页面商品信息数据

selenium自动化爬取京东电脑商品信息用于数据分析

Python爬取淘宝商品信息入库

python scrapy爬取当当网商品信息

Java爬虫爬取京东商品信息

利用Selenium爬取淘宝商品信息

java爬取闲鱼商品信息(二)

java爬取闲鱼商品信息(一)

python学习之爬取淘宝商品信息

java爬取闲鱼商品信息（三）

python爬虫 — 爬取淘宝商品信息

使用selenium爬取某宝商品信息

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)