使用Python爬取中国大学排名，并格式化对其输出内容 - 代码天地

使用Python爬取中国大学排名，并格式化对其输出内容

其他 2020-04-24 03:01:52 阅读次数: 0

首先，我们需要注意几点
1.可以使用isinstance语句配合bs4库中的bs4.element.Tag判断获取到的对象是不是标签对象.
2.输出内容并且要求他用空白补齐时，系统默认用的是英文空白符，英文空白符和中文空白符(chr(12288)获取)宽度不一样。

#代码使用python3.x编写
import requests
from bs4 import BeautifulSoup
import bs4 #导入bs4库是为了获取节点的对象类型是不是节点类型

def getHTMLText(url):
    r = requests.get(url,timeout=30)
    if(r.status_code != 200):
        return ""
    else:
        r.encoding = r.apparent_encoding
        return r.text
def fillUnivList(ulist,text):
    soup = BeautifulSoup(text, "html.parser")
    for tr in soup.find("tbody").children:
        # 判断是不是节点类型
        if isinstance(tr,bs4.element.Tag):
            tds = tr('td')#等同于tr.find_all('td')
            ulist.append([tds[0].next.string,tds[1].string,tds[3].string]) #获取子节点标签里面的内容，并放到ulist里面

def printUnivList(ulist,num):
    print(len(ulist))
    templte = "{0:{3}^10}\t{1:{3}^10}\t{2:{3}^10}" #0,1,2,3表示的是第几个参数:是必须写的，^表示居中对齐，5和10表示字符数量,{3}表示用第3个参数来填充，\t是横向制表符
    print(templte.format("序号","大学名称","分数",chr(12288))) #12288表示中文空格符号
    for i in range(num): #num控制显示数量
            print(templte.format(ulist[i][0],ulist[i][1],ulist[i][2],chr(12288)))


def main():
    url = "http://www.zuihaodaxue.cn/zuihaodaxuepaiming2017.html"
    htmlText = getHTMLText(url)
    uinfo = []
    fillUnivList(uinfo,htmlText)
    printUnivList(uinfo,20)

main()

发布了101 篇原创文章 · 获赞 13 · 访问量 9万+

私信关注

猜你喜欢

转载自blog.csdn.net/a735311619/article/details/78062962

使用Python爬取中国大学排名，并格式化对其输出内容

爬取中国大学排名

中国大学排名的爬取

python 爬虫实例爬取中国大学排名

定向爬虫，爬取中国大学排名 Python

python爬取中国大学排名

【python】爬取中国大学排名

国内大学排名如何？用Python爬取中国大学排名

中国大学排名定向爬取

实例一：中国大学排名爬取

爬取中国大学排名并以csv格式存储

【Python爬虫】从html里爬取中国大学排名

Python定向爬取单网页中国大学排名（一）

Python爬虫——定向爬取“中国大学排名网”

python-爬取中国大学排名（第五周）

python爬虫爬取2020年中国大学排名

Python爬虫入门实例三之爬取软科中国大学排名

2023年python爬取中国大学排名并且进行数据分析

python 中国大学排名

初学爬虫之访问goole网页与爬取中国大学排名。

网络爬虫爬取中国大学排名，并存入数据库

爬取中国大学排名时报错：AttributeError: 'NoneType' object has no attribute 'children'

2021-2-8爬取中国大学排名

Python使用BeautifulSoup与Requests爬取大学排名

爬2015年中国大学排名

定向爬取大学排名-Python

爬取全国大学排名用pyecharts进行可视化

中国大学定向排名爬取

记录慕课学习爬取中国大学排名（由上交大计算的排名结果）

Python 中国大学排名定向爬虫

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)