Beautiful Soup 解析html表格 - 代码天地

Beautiful Soup 解析html表格

其他 2018-12-31 23:17:58 阅读次数: 0

from bs4 import BeautifulSoup
import urllib.request
doc = urllib.request.urlopen('http://www.bkzy.org/Index/Declaration?intPageNo=1')
doc = doc.read().decode('utf-8')

soup = BeautifulSoup(doc, "html.parser")

school = 0
pro_code = 1
pro_name = 2
xuewei = 3
pdf = 4


# find_all 查到所有tr列表
for tr in soup.find_all('tr',):
　　# 在每个tr找td
    td = tr.find_all('td')
    try:
        print('%s_%s_%s_%s.pdf' % (
            td[school].text.strip(),
            td[pro_code].text.strip(),
            td[pro_name].text.strip(),
            td[xuewei].text.strip())
            ,td[pdf].find('a')['href'])
    except IndexError as e:
        pass

猜你喜欢

转载自www.cnblogs.com/BeyondTechnology/p/10203487.html

Beautiful Soup 解析html表格

【爬虫解析5】Beautiful Soup

Beautiful Soup解析工具简介

使用Beautiful Soup解析库

使用Beautiful Soup解析html文件

beautiful soup解析html获得数据

Beautiful Soup库——HTML/XML页面解析

Python之Html解析方法(beautiful soup)

HTML文档解析之Beautiful Soup

Beautiful Soup

Beautiful Soup解析库的安装和使用

Class 14 - 2 解析库 -- Beautiful Soup

解析库之Beautiful Soup（二）

解析库之Beautiful Soup（一）

Python 爬虫解析库的使用 --- Beautiful Soup

爬虫之解析库beautiful soup

python 解析库Beautiful Soup的安装

Beautiful Soup4数据解析与提取

Beautiful Soup 爬虫 + Pandas Dataframe，解析网页的 Table 表格数据

Python中解析 html 使用Beautiful Soup库

python Beautiful Soup解析html页面table标签

Beautiful Soup初步

Beautiful Soup (一）

Beautiful Soup 的使用

Beautiful Soup的用法

使用Beautiful Soup

Beautiful Soup 常用方法

Beautiful Soup 的使用问题

Python爬虫--Beautiful Soup

Beautiful Soup模块详解

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)