python爬虫--11 京东商城 - 代码天地

python爬虫--11 京东商城

其他 2020-03-17 15:55:02 阅读次数: 0

import requests
from bs4 import BeautifulSoup
## 获取网页信息
def getHtmlText(url):
    try:
        r = requests.get(url)
        r.raise_for_status()
        r.encoding =r.apparent_encoding
        return  r.text
    except:
        return 'false'

## 解析网页参数，获取商品信息
def parserHtml(goods_data,html):
    soup =BeautifulSoup(html,'html.parser')
    lis = soup.find_all('li',class_= 'gl-item')
    print(len(lis))
    for i in range(len(lis)):
        try:
            title = lis[i].a['title']
            price = lis[i].find('div',class_='p-price').i.string
            goods_data.append([title,price])
        except:
            print('')
## 输出数据
def  printHtmlGoods(goods_data):
    std = r'{0:^100}{1:^8}'
    print(std.format('商品名称', '价格'))
    for i in range(len(goods_data)):
        print(std.format(goods_data[i][0], goods_data[i][0]))

def main():
    url_basic = 'https://search.jd.com/Search?keyword='
    pages = 3
    keyword = '电脑'

    goods_data = []
    for i in range(pages):
        page = 1+i*2
        url = url_basic + keyword + '&enc=utf-8&wq'+ keyword + '&page=' + str(page)
        print(url)
        html =getHtmlText(url)
        parserHtml(goods_data,html)
    printHtmlGoods(goods_data)
if __name__ == '__main__':
    main()

发布了108 篇原创文章 · 获赞 7 · 访问量 5185

私信关注

猜你喜欢

转载自blog.csdn.net/qq_25672165/article/details/104914201

python爬虫--11 京东商城

京东商城大规模爬虫的开发

利用python爬虫爬取京东商城商品图片

[爬虫]Python+Selenium 爬取京东商城，翻页功能实现

python爬虫工程师成长之路五(一) 爬取京东商城图片

python爬虫实战：之爬取京东商城实例教程！（含源代码）

python爬虫 - 京东评论

爬虫selenium + chrome （PhantomJS）模拟浏览器抓取京东商城为例

Scrapy框架爬虫项目：京东商城笔记本电脑信息爬取

C# .NET 爬虫抓取京东商城所有商品分类

爬虫连载系列(3)--用Selenium+xpath爬取京东商城

爬虫利器Pyppeteer的介绍和使用爬取京东商城书籍信息

Python获取京东商城的商品分类，并将分类保存到csv

python构建基于知识图谱的京东商城问答系统-系统逻辑介绍

python构建基于知识图谱的京东商城问答系统-答案获取

python构建基于知识图谱的京东商城问答系统-实验环境和实验数据准备

python构建基于知识图谱的京东商城问答系统-目录

python构建基于知识图谱的京东商城问答系统-用户问题预处理

So Easy京东商城

京东商城大计划

京东商城选人的标准

仿京东商城

python爬虫-京东全网搜索

python 爬虫京东基金信息

一只初学者级别的京东商城商品爬虫（爬取索尼微单的参数信息）

京东商城--商城研发部面试

【vue】vue商城设计-模仿京东商城

京东商城（HTML和CSS实现京东商城网站）

京东商城还是用友总部

京东商城首页实现2.0

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)