爬虫打印不出淘宝商品信息 - 代码天地

爬虫打印不出淘宝商品信息

其他 2020-03-28 22:37:16 阅读次数: 0

在慕课网看的嵩天老师的课程，按照他的课程代码写的爬虫

#CrowTaobaoPrice.py
import requests
import re
 
def getHTMLText(url):
    try:
        r = requests.get(url, timeout=30)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return ""
     
def parsePage(ilt, html):
    try:
        plt = re.findall(r'\"view_price\"\:\"[\d\.]*\"',html)
        tlt = re.findall(r'\"raw_title\"\:\".*?\"',html)
        for i in range(len(plt)):
            price = eval(plt[i].split(':')[1])
            title = eval(tlt[i].split(':')[1])
            ilt.append([price , title])
    except:
        print("")
 
def printGoodsList(ilt):
    tplt = "{:4}\t{:8}\t{:16}"
    print(tplt.format("序号", "价格", "商品名称"))
    count = 0
    for g in ilt:
        count = count + 1
        print(tplt.format(count, g[0], g[1]))
         
def main():
    goods = '书包'
    depth = 3
    start_url = 'https://s.taobao.com/search?q=' + goods
    infoList = []
    for i in range(depth):
        try:
            url = start_url + '&s=' + str(44*i)
            html = getHTMLText(url)
            parsePage(infoList, html)
        except:
            continue
    printGoodsList(infoList)
     
main()

打印信息是这个

序号   价格       商品名称

也就是没有爬出任何淘宝上的信息，检查了一下网站和抓取函数getHTMLText(url)应该都没有问题，问题应该出在正则表达式的处理 parsePage(ilt, html)上面，但是反复对比还是找不到错误，哪位大神帮看一眼谢谢

转行编程小白

发布了4 篇原创文章 · 获赞 0 · 访问量 96

私信关注

猜你喜欢

转载自blog.csdn.net/sinat_39262698/article/details/104455717

爬虫打印不出淘宝商品信息

爬虫：淘宝商品信息定向爬虫

爬虫爬取淘宝商品信息

关于淘宝商品信息的爬虫

淘宝商品信息定向爬虫

python爬虫 — 爬取淘宝商品信息

python：爬虫获取淘宝/天猫的商品信息

python爬虫爬取淘宝网商品信息

淘宝商品信息定向爬虫实例介绍

Python爬虫爬取淘宝，京东商品信息

python关于一次淘宝商品信息的爬虫

实战 7 淘宝商品信息定向爬虫

Python爬虫之获取淘宝商品信息

Python爬虫学习笔记(实例：淘宝商品信息定向爬虫)

Python爬取淘宝商品信息

爬取淘宝商品信息

Python网络爬虫与信息提取（7）—— 用re库爬取淘宝商品信息

Chrome控制台毫无反应，打印不出信息了？

我要爬爬虫(11)-用selenium爬取淘宝商品信息

python2.7爬虫实现淘宝指定商品信息输出到excel中进行比价

（廿八）Python爬虫：使用Selenium爬取淘宝商品信息

python爬虫爬取淘宝搜索页面商品信息数据

利用Python打造了淘宝商品信息定向爬虫！老板给五千！我该收吗？

Python爬虫模拟浏览器的headers、cookie，爬取淘宝网商品信息

Python爬虫入门实例五之淘宝商品信息定向爬取(优化版)

Python爬虫实战：采集淘宝商品信息并导入EXCEL表格

Re(正则表达式)库入门及淘宝商品信息定向爬虫

Java 日志打印不出

抓取淘宝商品信息并制作商品信息比价表（以口红为例）

Python爬取淘宝商品信息入库

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)