python定向爬虫实例（三） - 代码天地

python定向爬虫实例（三）

其他 2019-08-13 23:19:16 阅读次数: 0

功能：爬取百度热搜的实时排行榜信息

程序设计：

爬取百度热搜网页的HTML文本
解析HTML文本获取排名、热度信息
将获取到的信息以字典的形式存储到文件中

代码：

#爬取百度热搜的实时排行榜
#技术路线：requests---bs4
import requests
from bs4 import BeautifulSoup

def getHTML(url):
    try:
        r=requests.get(url,headers={'User-Agent':'Mozilla/5.0'})
        r.raise_for_status()
        r.encoding=r.apparent_encoding
        return r.text
    except:
        return ""

def parseHTML(demo,file_path):
    f=open(file_path,"w")
    soup=BeautifulSoup(demo,"html.parser")
    num_list=soup.find_all('td','first')
    title_list=soup.find_all('a','list-title')
    for i in range(len(num_list)):
        info_dict={}
        try:
            info_dict.update({
                '排名':num_list[i].find('span').string,
                '标题':title_list[i].string,
            })
            f.write(str(info_dict)+'\n')
        except:
            continue
    f.close()
    print("爬取完毕!")
def main():
    url='http://top.baidu.com/buzz?b=1&fr=20811'
    file_path="D://百度实时热搜排行.txt"
    demo=getHTML(url)
    parseHTML(demo,file_path)

main()

结果：

猜你喜欢

转载自www.cnblogs.com/BUPT-MrWu/p/11349130.html

python定向爬虫实例（三）

python定向爬虫实例（二）

python 爬虫实例（三）

Python爬虫学习-股票数据定向爬虫（实例）

Python爬虫学习笔记(实例：股票信息定向爬虫及优化)

python定向爬虫实例-中国大学排名

【python爬虫学习笔记】07 股票数据定向爬虫实例

【python爬虫学习笔记】05 利用requests-bs4的大学排名定向爬虫的实例

Python爬虫学习-新华书店书本数据定向爬虫（实例）

Python爬虫学习笔记(实例：淘宝商品信息定向爬虫)

Python爬虫学习笔记(实例：中国好大学排名定向爬虫)

Python网络爬虫与信息提取笔记08-实例2：淘宝商品比价定向爬虫

python爬虫（三）：BeautifulSoup 【6. 实例】

【实例】—淘宝商品比价定向爬虫

python爬虫的重定向问题

Python3.6——"中国大学排名定向爬虫"实例介绍

Python爬虫入门实例五之淘宝商品信息定向爬取(优化版)

python重定向原理及实例

Python爬虫实例之淘宝商品比价定向爬取！爬虫还是很有意思的！

爬虫入门实例（三）

爬虫：中国大学排名定向爬虫实例

爬虫（五）“中国大学排名定向爬虫”实例

python爬虫实例 python爬虫实例

Python爬虫框架Scrapy实例（三）数据存储到MongoDB

爬取文秘站实例 - Python爬虫(三)

python网络爬虫三BeautifulSoup库及其实例操作

【Python】什么是爬虫，爬虫实例

Python网络爬虫实例

Python爬虫实例（一）

python爬虫简单实例

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)