python爬虫学习中国大学排名显示及保存文件 DAY3 - 代码天地

python爬虫学习中国大学排名显示及保存文件 DAY3

其他 2018-08-31 13:01:13 阅读次数: 0

import requests
from bs4 import BeautifulSoup
import bs4
 
def getHTMLText(url):
    try:
        r = requests.get(url, timeout=30)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return "爬取异常"
 
def fillUnivList(ulist, html):
    soup = BeautifulSoup(html, "html.parser")
    for tr in soup.find('tbody').children:
        if isinstance(tr, bs4.element.Tag):
            tds = tr('td')
            ulist.append([tds[0].string, tds[1].string, tds[3].string])
 
def printUnivList(ulist, num):
    tplt = "{0:^10}\t{1:{3}^10}\t{2:^10}"
    print(tplt.format("排名","学校名称","总分",chr(12288)))
    for i in range(num):
        u=ulist[i]
        print(tplt.format(u[0],u[1],u[2],chr(12288)))

def wtxt(ulist,num):
    f = open(r"C:\Users\lenovo\Desktop\中国大学排名.txt",'w+')
    ls = ['排名','学校名称','总分']
    s = "\t\t".join(ls)
    f.write(s+'\n')
    for i in range(num):
        line = ulist[i]
        line = "\t\t".join(line)
        f.write(line+'\n')
    f.close()
        
        
     
def main():
    uinfo = []
    url = 'http://www.zuihaodaxue.cn/zuihaodaxuepaiming2018.html'
    html = getHTMLText(url)
    fillUnivList(uinfo, html)
    printUnivList(uinfo, 20) # 20 univs
    wtxt(uinfo,20)
main()

猜你喜欢

转载自blog.csdn.net/u011451186/article/details/81237019

python爬虫学习中国大学排名显示及保存文件 DAY3

python学习，day3 文件的读写

python学习，day3：文件的修改

Python爬虫学习-Day3

爬虫学习 -- day3

python学习 day3

Python学习day3

python学习-day3

Python网络爬虫之中国大学排名爬虫代码实例分析学习笔记手札及代码实战

爬虫学习Day3：学习beautifulsoup

商业爬虫学习笔记day3

爬虫学习笔记----day3

python3爬虫-中国最好大学排名

python学习，day3：集合的学习

中国大学排名定向爬虫

爬虫中国大学排名

day3 python学习笔记 knn

python学习随笔Day3

Python学习笔记-DAY3

Python全栈学习day3

Python学习笔记Day3

Python学习笔记_Day3 列表

Python学习日记 --day3

python学习DAY3（列表）

python学习记录-day3

我的python学习--Day3

python 基础起步学习day3

Python学习总结__Day3

【Python学习笔记】- Day3

深度学习DAY3 Python入门

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)