python-爬取中国大学排名（第五周） - 代码天地

python-爬取中国大学排名（第五周）

其他 2020-03-21 20:50:51 阅读次数: 0

	第五周
所花时间	15h左右
代码量	1000行左右
博客量	4篇
学到的知识点	python基础的一些知识

摘要：通过学习，对python中的BeautifulSoup有了一定的了解，通过和之前学过的requests库结合，爬取了2019年中国大学的排名。（数据均来自HTML页面）

一、中国大学排名

import requests
from bs4 import BeautifulSoup
import bs4


def getHTMLText(url):
    try:
        r = requests.get(url, timeout=30)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return ""


def fillUnivList(ulist, html):
    soup = BeautifulSoup(html, "html.parser")
    for tr in soup.find('tbody').children:
        if isinstance(tr, bs4.element.Tag):
            tds = tr('td')
            ulist.append([tds[0].string, tds[1].string, tds[3].string])


def printUnivList(ulist, num):
    tplt = "{0:^10}\t{1:{3}^10}\t{2:^10}"
    print(tplt.format("排名", "学校名称", "总分", chr(12288)))
    for i in range(num):
        u = ulist[i]
        print(tplt.format(u[0], u[1], u[2], chr(12288)))


def main():
    uinfo = []
    url = 'http://www.zuihaodaxue.com/Greater_China_Ranking2019_0.html'
    html = getHTMLText(url)
    fillUnivList(uinfo, html)
    printUnivList(uinfo, 20)  # 20 univs


main()

中国大学排名

猜你喜欢

转载自www.cnblogs.com/MoooJL/p/12541924.html

python-爬取中国大学排名（第五周）

爬取中国大学排名

中国大学排名的爬取

python 爬虫实例爬取中国大学排名

定向爬虫，爬取中国大学排名 Python

python爬取中国大学排名

【python】爬取中国大学排名

国内大学排名如何？用Python爬取中国大学排名

中国大学排名定向爬取

实例一：中国大学排名爬取

【Python爬虫】从html里爬取中国大学排名

Python定向爬取单网页中国大学排名（一）

Python爬虫——定向爬取“中国大学排名网”

使用Python爬取中国大学排名，并格式化对其输出内容

python爬虫爬取2020年中国大学排名

Python爬虫入门实例三之爬取软科中国大学排名

2023年python爬取中国大学排名并且进行数据分析

python 中国大学排名

爬取中国大学排名并以csv格式存储

初学爬虫之访问goole网页与爬取中国大学排名。

网络爬虫爬取中国大学排名，并存入数据库

爬取中国大学排名时报错：AttributeError: 'NoneType' object has no attribute 'children'

2021-2-8爬取中国大学排名

爬2015年中国大学排名

定向爬取大学排名-Python

爬虫（五）“中国大学排名定向爬虫”实例

中国大学定向排名爬取

记录慕课学习爬取中国大学排名（由上交大计算的排名结果）

python爬虫笔记（五）网络爬虫之提取——实例优化：中国大学排名爬虫

python爬虫笔记（五）网络爬虫之提取——实例：中国大学排名爬虫

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)