xpath案例-全国城市名爬取 - 代码天地

xpath案例-全国城市名爬取

其他 2020-07-28 09:11:47 阅读次数: 0

#!/usr/bin/python

import requests 
from lxml import etree 
#项目需求：解析出所有的城市名称https://www.aqistudy.cn/historydata/

if __name__ == "__main__":
    # headers = {
    #     'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2626.106 Safari/537.36'
    # }

    # url = 'https://www.aqistudy.cn/historydata/'
    # page_text = requests.get(url=url,headers=headers).text

    # tree = etree.HTML(page_text)
    # host_li_list = tree.xpath('//div[@class="bottom"]/ul/li')
    # all_city_names = []
    # #解析到了热门城市的名称
    # for li in host_li_list:
    #     hot_city_name = li.xpath('./a/text()')[0]
    #     all_city_names.append(hot_city_name)


    # #解析的是全部城市的名称
    # city_names_list = tree.xpath('//div[@class="bottom"]/ul/div[2]/li')
    # for li in city_names_list:
    #     city_name = li.xpath('./a/text()')[0]
    #     all_city_names.append(city_name)


    # print(all_city_names,len(all_city_names))




    headers = {
        'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2626.106 Safari/537.36'
    }

    url = 'https://www.aqistudy.cn/historydata/'
    page_text = requests.get(url=url,headers=headers).text

    tree = etree.HTML(page_text)
    #解析到热门城市和所有城市对应的a标签
    #   //div[@class="bottom"]/ul/li/          热门城市a标签的层级关系
    #   //div[@class="bottom"]/ul/div[2]/li/a  所有城市a标签的层级关系
    a_list= tree.xpath('//div[@class="bottom"]/ul/li/a | //div[@class="bottom"]/ul/div[2]/li/a')
    all_city_names = []
    for a in a_list:
        city_name = a.xpath('./text()')[0]
        all_city_names.append(city_name)
    print(all_city_names,len(all_city_names))

猜你喜欢

转载自www.cnblogs.com/gerenboke/p/13389036.html

xpath案例-全国城市名爬取

xpath 实战之全国城市名字爬取

【老男该】爬虫学习笔记P19-P28正则解析案例02bs4的具体解析的使用bs4的解析案例实战xpath解析案例-全国城市名称的爬取

根据城市名和分类名爬取对应的POI数据（基于高德地图）

爬取某城市公交钱路--xpath过滤

xpath爬取相应网址中的全部城市

爬取全国各个城市的最低气温

python爬虫学习（十四）xpath获取不同标签城市名

网络爬虫 - 5 Xpath的使用方法与爬取案例

xpath案例-4K图片爬取

全国邮编爬取

python爬虫学习之爬取全国各省市县级城市邮政编码

如何用 Python 自动爬取全国 30+ 城市地铁图数据？

利用Python自动爬取全国30+城市地铁图数据

爬取全国城市近5.6年来空气质量情况

爬取携程7天内的全国所有城市航班

全国315个城市，用python爬取肯德基老爷爷的店面信息

【最新】python爬取全国主要城市经纬度

python爬取全国13个城市旅游数据，告诉你那里最受欢迎

爬取全国城市及辖区的人口、面积、行政区划代码及邮编

xpath；；利用xpath爬取电影天堂

你在的城市撒币了吗？Python爬取全国各城市消费券发放数据并分析

利用xpath爬取网页

xpath-房价爬取

python xpath图片爬取

爬取千千小说 -- xpath

使用xpath爬取数据

爬虫小案例爬取百度贴吧杨幂图片 xpath 美丽汤

案例_(单线程)使用xpath爬取糗事百科

初探爬虫：xpath提取信息，爬取页面小案例

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)