python爬取数据保存为txt格式 - 代码天地

python爬取数据保存为txt格式

其他 2018-08-31 14:18:43 阅读次数: 0

#encoding:'utf-8'
import urllib.request
from bs4 import BeautifulSoup
import os
import time
#找到网址
def getDatas():
   url="https://movie.douban.com/top250"
   # url="file:///E:/scrapy/2018-04-27/movie/movie.html"
   # 打开网页
   res=urllib.request.urlopen(url)
   # 转化格式
   response=BeautifulSoup(res,'html.parser')
   # 找到想要数据的父元素
   datas=response.find_all('div',{'class':'item'})
   # print(datas)
   #创建存放数据的文件夹
   folder_name="output"
   if not os.path.exists(folder_name):
           os.mkdir(folder_name)
   # 定义文件
   current_time=time.strftime('%Y-%m-%d',time.localtime())
   file_name="move"+current_time+".txt"
   # 文件路径
   file_path=folder_name+"/"+file_name

   for item in datas:
       # print(item)
       rank=item.find('div',{'class':'pic'}).find('em').get_text()
       title=item.find('div',{'class':'info'}).find('div',{'class':'hd'}).find('a').find('span',{'class':'title'}).get_text()
       picUrl=item.find('div',{'class':'pic'}).find('a').find('img').get('src')
       # print(picUrl)
       # 保存数据为txt格式
       try:
           with open(file_path,'a',encoding="utf-8") as fp:
               fp.write("排名:"+rank+'\n')
               fp.write("标题:"+title+'\n')
               fp.write("图片路径:"+picUrl+'\n\n')
       except IOError as err:
           print('error'+str(err))
       finally:
           fp.close()
   pass

getDatas()
# 爬取数据

猜你喜欢

转载自blog.csdn.net/zhanghl150426/article/details/82022417

python爬取数据保存为txt格式

python爬取数据保存为MySQl格式

python爬取数据保存为Json格式

python用akshare批量爬取金融数据并保存为excel格式

python爬取数据保存为图片

Matlab将mat格式数据保存为txt格式

python爬取中国天气网天气并保存为word格式文件

python爬取中国天气网天气并保存为csv格式文件

Python 爬取数电教案并保存为pdf

python爬取多个网页表格并保存为csv

python爬取昵称并保存为vss

python | 将列表数据按行保存为txt格式并进行读取

【Python爬虫】使用美味汤BeautifulSoup爬取数据并保存为Excel文件

Python将数据保存为txt文件的方法

史**_python保存为txt

scrapy数据保存为txt

scrapy把数据保存为txt形式

【网络爬虫】爬取网络小说并保存为txt

Python爬虫之bilibili视频弹幕爬取并保存为JSON格式（详解分析+代码实现）

python 将数据保存为excel的xls格式

利用requests和BeautifulSoup爬取菜鸟教程的代码与图片并保存为markdown格式

Python爬取全国最新房价信息保存为CSV文件,进行简单的数据分析

txt格式保存为pcd点云

python--爬取豆瓣热门国产电视剧保存为文件

python中Scrapy实战之爬取网页并保存为json文件

python爬取安居客地图页信息，并保存为csv文件

Android爬虫Jsoup爬取某招聘网站数据并保存为exceL文件

Vue组件-爬取页面表格中的数据并保存为csv文件

爬取表格类网站数据并保存为excel文件

Python批量将csv保存为txt

今日推荐

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

虽然老乡鸡开源的不是代码，但背后的原因却让人很暖心

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

周排行

使用Redis中间件解决商品秒杀活动中出现的超卖问题（使用Java多线程模拟高并发环境）

野指针及c++指针使用注意点

redis 3.0　新特性

(翻译)火狐操作系统javascript API

微信小程序开发入门

mysql数据查询之五子句(where、group by、having、order by和limit)

Codeforces Round #517 Div. 1翻车记

在caffe 中实现Generative Adversarial Nets（二）

企业级漏洞扫描工具

java byte数组与String互转

每日归档

更多

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)