爬取定向网页大学排名 - 代码天地

爬取定向网页大学排名

其他 2019-10-02 10:41:16 阅读次数: 0

网页链接：

http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html

效果：

# coding=utf-8
import requests
from bs4 import BeautifulSoup
import bs4
def getHTML(url):
    try:
        r=requests.get(url,timeout=30)   #获取请求
        r.raise_for_status                 #请求状态
        r.encoding=r.apparent_encoding   #编码
        return r.text
    except:
        return ""
def getUnlist(unifo,html):
    soup=BeautifulSoup(html,"html.parser")   
    for tr in soup.find('tbody').find_all('tr'):  #找到tbody内的所有tr
        tds=tr.find_all('td')
        unifo.append([tds[0].string,tds[1].string,tds[3].string])
        
def printUnlist(unifo,num):
    tplt="{0:^10}\t{1:{3}^15}\t{2:^10}"
    print(tplt.format("排名","大学名称","分数",chr(12288))) #用中文字符补全
    for i in range(num):
        t=unifo[i]
        print(tplt.format(t[0],t[1],t[2],chr(12288)))
def main():
    url="http://www.zuihaodaxue.cn/zuihaodaxuepaiming2016.html"
    html=getHTML(url)
    unifo=[]
    getUnlist(unifo,html)
    printUnlist(unifo,20)
main()

猜你喜欢

转载自www.cnblogs.com/ww123/p/11616852.html

爬取定向网页大学排名

定向爬取大学排名-Python

Python定向爬取单网页中国大学排名（一）

中国大学排名定向爬取

定向爬虫，爬取中国大学排名 Python

爬取中国大学排名

爬虫爬取大学排名示例

中国大学排名的爬取

爬虫练手小实例---【大学排名定向爬取】

Python爬虫——定向爬取“中国大学排名网”

标记信息形式&&提取方法&&定向爬取中国最好大学排名

初学爬虫之访问goole网页与爬取中国大学排名。

python爬取大学排名，电影的排名与评分

国内大学排名如何？用Python爬取中国大学排名

用Excel爬取大学排名信息

爬取软科中国最好大学排名

python 爬虫实例爬取中国大学排名

爬取高考派大学排名动态代码

Python使用BeautifulSoup与Requests爬取大学排名

实例一：中国大学排名爬取

python爬虫爬取最好大学排名

爬虫爬取最好大学排名

Python爬虫之BeautifulSoup库——爬取大学排名

python爬取中国大学排名

【python】爬取中国大学排名

中国大学定向排名爬取

中国大学排名定向爬虫

使用Python爬取最好大学网大学排名

使用python爬虫爬取最好大学网大学排名实例

Python 最好大学网大学排名爬取（2020年）

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)