python3 爬表格数据 - 代码天地

python3 爬表格数据

其他 2019-01-21 16:28:02 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/qq_35774189/article/details/86526240

数据网址：http://gaokao.xdf.cn/201812/10838484.html

https://www.maigoo.com/news/509088.html

代码段：

from bs4 import BeautifulSoup

import requests
import csv

#检查url地址  
def check_link(url):
    try:
        r = requests.get(url)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        return r.text
    except:
        print('无法链接服务器！！！')

#爬取资源  
def get_contents(ulist,rurl):
    soup = BeautifulSoup(rurl,'lxml')
    trs = soup.find_all('tr')
    for tr in trs:
        ui = []
        for td in tr:
            ui.append(td.string)
        ulist.append(ui)

#保存资源  
def save_contents(urlist):
    try:
        with open("500强数据.csv",'w') as f:
            writer = csv.writer(f)
            writer.writerow(['2018中国企业500强完整榜单'])
            for i in range(len(urlist)):
                writer.writerow([urlist[i][1],urlist[i][3],urlist[i][5]])
    except:
        pass

def main():
    urli = []
    url = "https://www.maigoo.com/news/509088.html"
    rs = check_link(url)
    get_contents(urli,rs)
    save_contents(urli)

main()

链接：https://pan.baidu.com/s/1DaNAh3BWVbo__KqheRKqXA 提取码：y075

同参考文章： https://blog.csdn.net/weixin_41059146/article/details/78605081

https://blog.csdn.net/weixin_42459037/article/details/84024839

猜你喜欢

转载自blog.csdn.net/qq_35774189/article/details/86526240

python3 爬表格数据

python3将爬取的数据写入execl表格

学会Python3模拟登录并爬取表格数据！excel高手也自叹不如！

python3 爬取影像数据

python3 爬取API数据

python3 爬取网页表格例子

python爬虫,爬取表格数据

Python3.模拟表单提交、爬取表格数据

Python3 以table表格的形式打印数据

使用python3爬取数据至mysql

使用python3爬取数据至csv

Python3 selenium 网页table数据抓爬

Python3爬取百度文库数据

Python3 -- 数据概念

Python3 打印表格

用python3制作表格

python3 读取Excel表格

python3读取excel表格

Python3绘制整齐的表格

python3 xlrd读取xls表格

Python3 表格超链接

Python3入门教程｜｜Python3 数据结构｜｜Python3 模块

Python3 入门教程｜｜Python3 数据结构｜｜Python3 模块

python3爬取网页图片

python3 爬去QQ音乐

Python3——爬取淘宝评论

python3爬取图片

python3爬取租房的信息

python3自动爬笑话

使用Python3爬取美女

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)