一个简易的Python爬虫，将爬取到的数据写入txt文档中 - 代码天地

一个简易的Python爬虫，将爬取到的数据写入txt文档中

其他 2019-04-15 22:11:22 阅读次数: 0

代码如下：

import requests
import re
import os

#url
url = "http://wiki.akbfun48.com/index.php?title=%E4%B9%83%E6%9C%A8%E5%9D%82%E5%B7%A5%E4%BA%8B%E4%B8%AD&variant=zh-hans"

#请求头
headers = {

    "User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36",
    "Referer":url
}

r = requests.get(url,headers=headers)
if r.status_code == 200:        #响应200为请求成功
    r.encoding = r.apparent_encoding        #转换字符编码
    html = r.text

    #正则表达式匹配数据，获取数据列表
    list = re.findall(r'>http://www.bilibili.com/video/av.*\/<',html)
    count = 0
    #循环列表，将数据写入txt文档中
    for i in list:
        count += 1
        #如果没有txt文件则新建文件，并执行写入操作
        with open("abc.txt",'a',encoding='utf-8') as f:
            f.write("ep"+str(count)+i+'\n')
            print("success")
else:
    print(404)

运行效果如下：

执行后，会在本程序的路径下新建abc.txt文件，并保存爬取的数据

猜你喜欢

转载自www.cnblogs.com/Hotaru-Xin/p/10713428.html

一个简易的Python爬虫，将爬取到的数据写入txt文档中

将目录中的多个指定.txt文档写入另一个txt文件中

【爬虫】 02 将爬取到的网页写入文件中

将txt文档中的数据读取到csv文档中

Python：将 list 写入一个 txt 文件

Python读取数据库写入TXT中（一条数据写入一个TXT文本）

python将一个txt文档的内容转为字典格式/将字典格式存储到txt文档中

五分钟写一个小爬虫，爬取小说并写入txt文件

python将一个txt文档中各种文件按照扩展名进行分类

Python读取txt文件应用---用python实现读取一个txt文档，并根据相应判断条件在txt文件中，每一行内写入指定数据。

Python爬虫(四) —— 将爬取到的数据进行存储

python爬虫（一）简单爬取文字写入txt

《崔庆才Python3网络爬虫开发实战教程》学习笔记（5）：将爬虫爬取到的数据存储到TXT，Word，Excel，Json等文件中

python 爬虫 txt文档的读取和写入

Python：将 list 写入一个 txt 文件四种方法

QT将图像数据写入txt文档

Python将爬虫爬取信息写入Excel中

python读写文件详解，将数据写入一个文件或读一个文件写入另一个文件中。

python爬虫示例爬取网页信息，并且将爬取到的信息存入数据库。

Scrapy爬取全网小说到本地TXT，Python少年最爱的一个爬虫项目！

将一个内表中的数据，读取到structure中。不用loop循环.

数据写入到TXT文档中

将一个文件夹下的多个目录生成txt文本,并且写入到Excel中

将txt文档中的字符串中两个相邻的逗号替换成一个逗号

爬虫2 requests+bs4爬汽车之家新闻, bs4的使用(遍历文档树和查找文档树), 搭一个免费的代理池, 验证码破解(超级鹰), 爬取糗事百科段子自动通过微信发给好友, 爬取(拉钩职位, cnblogs新闻, 红楼梦小说写入txt, 肯德基餐厅信息), 爬取博客园写入mysql

Python将txt文本中的每一行读成列表中的一个元素

matlab将数据读取和写入txt文档

将单个字节数据读取到一个float类型的数据中---的几种方法

Python爬虫实战，requests+openpyxl模块，爬取小说数据并保存txt文档（附源码）

python创建一个word文档并写入内容

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)