python爬虫二 - 代码天地

python爬虫二

其他 2018-05-29 18:47:19 阅读次数: 0

from bs4 import BeautifulSoup
import  requests

def getHTMLText():
  try:
      r=requests.get(url,timeout=30)
      r.raise_for_status()
      r.encoding=r.apparent_encoding
      return r.text
  except:
      return ""


def  parsePage(ilt,html):
    try:
        plt=re.findall(r'\"view_prie\"\:\"[\d\.]*\"',html)
        tlt=re.findall(r'\"raw_title\"\:\".*?\"',html)
        for i in  range(len(plt)):
            price=eval(plt[i].split(':')[1])
            title=eval(tlt[i].split(':')[1])
            ilt.append([price,title])
    except:
        print("")

def printGoodList(ilt):
    tplt="{:4}\t{:8}\t{:16}"
    print(tplt.format("序号","价格","商品名称"))
    count=0
    for g in ilt:
        count=count+1
        print(tplt.format(count,g[0],g[1]))


def main():
    goods='书包'
    depth=2
    start_url='https://s.taobao.com/search?q'+goods
    infoList=[]
    for i in range(depth):
        try:
            url=start_url+'&s='+str(44*i)
            html=getHTMLText(url)
            parsePage(infoList,html)
        except:
            continue
    printGoodList(infoList)
main()

猜你喜欢

转载自blog.csdn.net/c11611/article/details/72758205

Python爬虫学习（二）

python爬虫二

python 爬虫初探二

python爬虫（二）

python爬虫系列（二）

Python 爬虫 (二)

python爬虫笔记（二）

《python初级爬虫》（二）

PYTHON爬虫（实战二）

python网络爬虫二

Python爬虫学习二

Python爬虫之二

python爬虫(二)-------------------Xpath

Python爬虫(二) | requests

python爬虫入门（二）

Python爬虫--Xpath（二）

Python爬虫——案例（二）

Python爬虫实战（二）

python爬虫学习(二)

Python爬虫（二）网络爬虫的尺寸与约束

Python 爬虫（二）爬虫基本入门

python | 爬虫笔记（二）- 爬虫基础

python爬虫笔记（二）爬虫基础

python之爬虫（二）爬虫的原理

python爬虫（二）requests与BeautifulSoap

Python爬虫学习日记二

python爬虫(二)简单的架构

Python网络爬虫学习（二）

python 爬虫scrapy框架（二）

Python 爬虫 ---- Beautiful Soup（二）

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)