爬虫（4）爬取数据写入excel - 代码天地

爬虫（4）爬取数据写入excel

其他 2021-03-24 03:16:00 阅读次数: 0

话不多说，先贴代码

from selenium import webdriver
from bs4 import BeautifulSoup
import csv

driver=webdriver.Chrome()
url="https://www.kylc.com/stats/global/yearly/g_gdp/1960.html"
xpath="/html/body/div[2]/div[1]/div[5]/div[1]/div/div/div/table"
driver.get(url)
tablel=driver.find_element_by_xpath(xpath).get_attribute('innerHTML')

out=open('d:/gdp.csv','w',newline='')
csv_write=csv.writer(out,dialect='excel')

soup=BeautifulSoup(tablel,"html.parser")
table=soup.find_all('tr')
for row in table:
    cols=[col.text for col in row.find_all('td')]
    if len(cols)==0 or not cols[0].isdigit():
        continue
    csv_write.writerow(cols)
out.close()
driver.close()

这次更改的地方如下

import csv
out=open('d:/gdp.csv','w',newline='')
csv_write=csv.writer(out,dialect='excel')
for row in table:
    cols=[col.text for col in row.find_all('td')]
    if len(cols)==0 or not cols[0].isdigit():
        continue
    csv_write.writerow(cols)
out.close()
driver.close()

引入了csv库，将爬取内容写入D盘的gdp.csv文件中，
同时删除了print(cols)
因为爬取内容可以直接看excel
使用
out.close()
driver.close()
关闭文件和网页

猜你喜欢

转载自blog.csdn.net/qq_53029299/article/details/114851062

爬虫（4）爬取数据写入excel

Python3爬虫之五：爬取网站数据并写入excel

Python 爬取数据（实例实操），并写入excel文件

爬虫学习打卡5——将爬取数据放入Excel

python爬虫——爬取数据导入excel表

简易python爬虫爬取boss直聘职位，并写入excel

php从爬虫爬取的txt文件按行读取并写入保存到excel，csv中

Python爬虫经典案例详解：爬取豆瓣电影写入Excel表格

网络爬虫爬取数据的4种类型

爬虫项目4[爬取斗鱼直播数据]

python_将爬取的百度地图迁徙json数据写入到excel

Python学习笔记14：爬取51job数据，并写入excel中

Python利用get、post请求爬取数据并写入Excel表格

使用EXCEL爬取数据

PHP爬虫框架phpspider(二) - 分页爬取写入数据库

Python3：小爬虫成长记（三）---爬取数据并写入到文件

网络爬虫：Python+requests+re+xlwt 爬取淘宝商品并把价格和名字写入Excel表格

Python爬虫实战（四）：利用代理IP爬取某瓣电影排行榜并写入Excel（附上完整源码）

网络爬虫：Python+requests+bs4+xlwt 爬取京东商品存入Excel表

将爬取的电影解析并写入excel中

python爬虫（一）简单爬取文字写入txt

爬虫（进阶），爬取网页信息并写入json文件

Python将爬虫爬取信息写入Excel中

使用Nodejs爬取网页某个数据并把爬到的数据写入excel (服务端部分)

Python3.5-爬虫实战-爬取网页数据并且导入excel

Android爬虫Jsoup爬取某招聘网站数据并保存为exceL文件

Python爬虫项目：爬取JSON数据存储Excel表格与存储图片

【Python爬虫】使用美味汤BeautifulSoup爬取数据并保存为Excel文件

爬取拉钩网职位信息写入mongodb数据库（小白学爬虫--实战篇1）

bs4爬取漫画并写入TXT文档

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)