python京东爬虫保存到表格中 - 代码天地

python京东爬虫保存到表格中

其他 2018-07-26 23:26:02 阅读次数: 0

import requests#获取网页模块
from bs4 import BeautifulSoup#网页解析模块
import html5lib#网页解析方法
import csv#写入表格模块
try:
    kw = input('请输入需要查询的商品名：')#用户输入关键词
    kv = {'user-Agent': 'Mozilla/5.0'}#模拟浏览器
    url = 'https://search.jd.com/Search'#京东搜索网址
    start_page=1#起始页：1
    end_page=10#结束页：10
    filename = kw+'.csv'#写入的表格名称
    outputfile=open(filename,'w',newline='') #以写方式打开表格，取消空行
    #创建一个csv.writer对象  传入一个文件句柄,默认以逗号作为分隔符
    csv_writer = csv.writer(outputfile, dialect='excel') 
    while start_page < end_page:
        wd = {'keyword':kw,'enc':'utf-8','wq':kw,'page':start_page}#参数
        r = requests.get(url, params=wd, headers=kv)#链接，参数，头部
        r.encoding = r.apparent_encoding
        # print(r.status_code)#输出状态码
        # print(r.request.headers)#输出浏览器头部信息
        # print(r.request.url)#输出网址
        # print(r.text[0:2000])#乱码
        html= str(r.content,'utf-8')#解决乱码问题
        soup = BeautifulSoup(html,'html5lib')#用html.parser解析
        #搜索标签是div，属性是class：p-name 的 代码
        # contents=soup.find_all('div',attrs={'class':'p-name'})
        contents = soup.select('.gl-i-wrap')#选择一个笔记本的大框
        for bi in contents:
            bi_title = bi.select('.p-name > a > em')[0]#选择一个笔记本的标题框
            if(bi_title.font):#如果有font 
                bi_title.font.decompose()#找到里面的font标签并删除
            bi_title = bi_title.text#获取里面的内容，去除标签
            print(bi_title)
            bi_price = bi.select('.p-price > strong > i')[0].string#价格
            print(bi_price)
            bi_pingjia = bi.select('.p-commit > strong > a')[0].string#评价条数
            print(bi_pingjia+'条评价')
            #将商品信息写入csv文件中
            csv_writer.writerow([bi_title,bi_price,bi_pingjia])
        start_page +=2
except:
    print("爬取失败！！！！")

猜你喜欢

转载自blog.csdn.net/qq_32674347/article/details/81109121

python京东爬虫保存到表格中

python提取pdf表格数据并保存到excel中

Python爬虫数据保存到MongoDB中

python实现同一word中的表格分别提取并保存到不同文件下

教你将python运行的数据保存到xlsx表格中

python3从本地excel表格获取账号，实现后台系统的登录，并获取运费后保存到表格中

【Python爬虫】Requests 请求并读写、保存到excel文件中

用python提取PDF表格内容保存到excel

python 算法测试结果自动保存到excel表格

python 数据如何保存到excel中

将python 中的变量保存到本地

Python爬虫实战：Scrapy爬取京东商品数据保存到Mysql且重命名下载商品图片

python爬虫解析图片保存到本地

python爬虫：将数据保存到本地

Python爬虫实战：批量采集股票数据，并保存到Excel中

python[番外篇]：python数据如何保存到excel中

python读取sqlserver数据，并保存到csv中

【Python】将print输出的内容保存到txt文件中

Python将print输出内容保存到指定文件中

python读取Excel数据保存到mongoDB中

python读取mongoDb数据库保存到Excel中

Python如何爬取数据保存到Excel中？

python 将print输出的内容保存到txt文件中

Python爬虫（二）：爬虫获取数据保存到文件

Python爬虫：爬虫获取数据保存到文件

Python 使用openpyxl导出Excel表格的时候，使用save()保存到指定路径

Python爬取猫眼电影100榜并保存到excel表格

python爬取URL动态生成的table表格并保存到文件

python识别pdf中的表格并保存execl

爬虫实战：Requests+BeautifulSoup 爬取京东内衣信息并导入表格（python）

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)