1-打印微博热搜榜

点击微博热搜榜,找到热搜榜,将其中带有 热、沸、新字样的热搜信息获取到,并注明属于三种当中的哪一种

from selenium import webdriver
from selenium.webdriver.common.by import By # 设置元素定位使用哪种方法
from selenium.webdriver.support.ui import WebDriverWait # 元素等待类
from selenium.webdriver.support import expected_conditions as EC # 提供条件判断函数

browser = webdriver.Chrome()
browser.get('https://m.weibo.cn/')
# 点击大家都在搜
browser.find_element_by_partial_link_text('大家都在搜').click()
# 点击微博热搜榜并等待
WebDriverWait(browser,5,0.5).until(
    EC.visibility_of_element_located(
        (By.XPATH,'//div[@class="card m-panel card16 m-col-2"]//div[8]//h4[@class="m-text-cut"]')
    )
).click()
# 获取微博热搜,并剔除没有热搜图标的热搜
# 等待加载完成
WebDriverWait(browser,5,0.5).until(
    EC.visibility_of_element_located(
        (By.XPATH,'//div[@class="card card11"][1]//div[@callback="clearUnread()"]')
    )
)
hotSearchList = browser.find_elements_by_xpath('//div[@class="card card11"][1]//div[@callback="clearUnread()"]')
for ele in hotSearchList:
    imglist = ele.find_elements_by_xpath('.//span[@class="m-link-icon"]/img')
    if imglist:
        # 获取图片链接
        srcText = imglist[0].get_attribute('src')
        if 'hot' in srcText:
            type = '热'
            text = ele.find_element_by_xpath('.//span[@class="main-text m-text-cut"]').text
            print(f'{type}:{text}')
        elif 'fei' in srcText:
            type = '沸'
            text = ele.find_element_by_xpath('.//span[@class="main-text m-text-cut"]').text
            print(f'{type}:{text}')
        elif 'new' in srcText:
            type = '新'
            text = ele.find_element_by_xpath('.//span[@class="main-text m-text-cut"]').text
            print(f'{type}:{text}')
browser.quit()

打印结果:

:最高检部署加强未成年人司法保护
新:程莉莎宣璐左小青阿兰金巧巧淘汰
新:骗保将处骗取金额2倍以上5倍以下罚款
新:李菲儿说入行十几年没有代表作
新:中纪委评论你好李焕英
热:韩国女子咬掉性侵者舌头被判无罪
新:杨丞琳曾黎苏运莹踢馆姐姐
热:知情人称吴秀波今后将不再从事演员职业
新:饿了么向骑手致歉
新:男孩吃饺子吞下2枚硬币1年后取出
新:张小斐怼脸自拍
新:陈小纭国风漫画造型
热:曾志伟小儿子曾国猷离婚
新:四川绵阳网红桥断裂多人坠伤
新:美国最年长少年犯服刑68年出狱
新:阿兰发长文告别姐姐2:大妈为造桃花雨强行摇拽桃树
新:暗恋橘生淮南同学录
新:四川一景点现单向透明厕所
新:国防部回应报道边防斗争一线官兵事迹
新:欧文骗飞詹姆斯
新:43批次网售休闲服装不合格

猜你喜欢

转载自blog.csdn.net/weixin_45128456/article/details/113866038
今日推荐