爬取湖北师范大学招生信息网中的专业简介 - 代码天地

爬取湖北师范大学招生信息网中的专业简介

其他 2019-11-23 15:18:04 阅读次数: 0

　　昨天老师安排了一场考试，我分配到的题目是 “http://zhinengdayi.com/hbnu爬取院系专业中的专业简介”。

　　进入网站后，我找到了专业简介介绍

　　通过肉眼观察我发现，我所需爬取的内容是一个网页表格，检查发现果然如此

　　思路：当时我看到这个题目立马想到书上有个例题，是爬取中国最好大学排行榜，它也是一个网页表格。

# 导入所需的库
import requests
from bs4 import BeautifulSoup

# 解决乱码问题
import io
import sys
sys.stdout=io.TextIOWrapper(sys.stdout.buffer,encoding='gb18030')

# 请求
r=requests.get("http://zhinengdayi.com/page/detail/LSPJPH/489/1040")
result=r.text

# 解析html源码
soup=BeautifulSoup(result,'html.parser')
name=soup.find_all('th')
com=soup.find_all('tr')

# 将数据导入CSV文件
fr=open("jianjie.csv","a")
li=[]
for i in name:
    li.append(i.text)
fr.write(",".join(li)+"\n")
for tr in com:
    ltd=tr.find_all('td')
    if len(ltd)==0:
        continue
    li1=[]
    for td in ltd:
        li1.append(td.text)
    fr.write(",".join(li1)+"\n")
fr.close()

　　上述代码是我根据题目要求所编写的源码，重点在将数据导入CSV文件。

fr=open("jianjie.csv","a")

　　这行代码是以a读写文件，即没有该文件就创建，有则打开文件并在其后添加列表。

fr.write(",".join(li)+"\n"

　　将列表数据写入CSV文件，以逗号为分隔符，加入后换行。

　　最后，fr.close()关闭文件。

　　以下是运行结果：

2019-11-23 14:56:01

猜你喜欢

转载自www.cnblogs.com/DrcProgrammingCool/p/11918027.html

爬取湖北师范大学招生信息网中的专业简介

爬取湖北师范大学官网公告和具体内容并保存成json格式

湖北师范大学操作系统实验

爬虫---爬取拉钩信息网

【调剂】河南师范大学硕士招生预调剂信息收集的通知

[2018西北师范大学_助教博客] 助教总结

201771010142-张燕实验三结对项目—《西北师范大学疫情防控信息系统》项目报告

201771010132-徐思实验三结对项目-《西北师范大学疫情防控信息系统》

201771010141-周强-结对项目-《西北师范大学疫情防控信息系统》项目报告

那一年，我考入了西北师范大学GIS专业，然而我很迷茫，GISer的职业规划到底是怎样的？

201771010143-张云飞实验二个人项目—《西北师范大学学生疫情信息上报系统》项目报告

201771030121-王国伟实验三结对项目—《西北师范大学疫情防控信息系统》项目报告

201771030118-司绍斌实验三结对项目—《西北师范大学疫情防控信息系统》项目报告

201771010111-李瑞红实验三结对项目—《西北师范大学疫情防控信息系统》项目报告

201771010134-杨其菊实验三结对项目—《西北师范大学疫情防控信息系统》项目报告

201771010133-杨玲实验三结对项目—《西北师范大学疫情防控信息系统》项目报告

201771030114-马强实验三结对项目—《西北师范大学疫情防控信息系统》项目报告

201771010116-马凯军实验三结对项目—《西北师范大学疫情防控信息系统》项目报告

201771030105-范铂真实验三结对项目—《西北师范大学疫情防控信息系统》项目报告

201771010104-狄慧实验三结对项目-《西北师范大学疫情防控信息系统》项目报告

201771030129-张琳实验三结对项目—《西北师范大学疫情防控信息系统》项目报告

201271050130-滕江南实验三结对项目—《西北师范大学疫情防控信息系统》项目报告

201771010110-孔维滢实验三结对项目—《西北师范大学疫情防控信息系统》项目报告

201771010103—陈亚茹—实验三结对项目—《西北师范大学疫情防控信息系统》项目报告

201771010130-王志成实验三结对项目—《西北师范大学疫情防控信息系统》项目报告

201771030112-刘永胜实验三结对项目—《西北师范大学疫情防控信息系统》项目报告

201771030110-李松谕实验三结对项目—《西北师范大学疫情防控信息系统》项目报告

201771010105—达拉草—实验三结对项目—《西北师范大学疫情防控信息系统》项目报告

201771010101-白玛次仁实验三结对项目—《西北师范大学疫情防控信息系统》项目报告

201771010102-常惠琢实验三结对项目—《西北师范大学疫情防控信息系统》项目报告

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)