python收集数据 - 代码天地

python收集数据

其他 2020-04-16 09:39:48 阅读次数: 0

1、request库

import requests
response=request.get(url)
response.content//得到了字节，而不是text

2、beautifulsoup 解析html

3、如果从request得到了文本，如下解析成dataframe

df_list = []
for ebert_review in glob.glob('ebert_reviews/*.txt'):
    with open(ebert_review, encoding='utf-8') as file:
        title = file.readline()[:-1]
        # 这里是你的代码

        # 添加到字典列表中
        df_list.append({'title': title,
                        'review_url': review_url,
                        'review_text': review_text})
df = pd.DataFrame(df_list, columns = ['title', 'review_url', 'review_text'])

4、MediaWiki API

5、处理图片等非文本数据

import requests
from PIL import Image
from io import BytesIO
r = requests.get(url)
i = Image.open(BytesIO(r.content))

6、保存到csv

//第一个参数是路径，第二个参数是不把df的索引显示为csv的列
df.to_csv('dataset.csv', index=False)

4、word_cloud可视化库

发布了185 篇原创文章 · 获赞 6 · 访问量 7万+

私信关注

猜你喜欢

转载自blog.csdn.net/JackLi31742/article/details/104808084

python收集数据

收集数据

表单 - 收集数据

Python Scrapy多层爬取收集数据

使用 Flume 收集数据

用流收集数据

相关收集数据途径

ASH不收集数据

收集数据库 AWR报告

ACCESS中通过邮件收集数据

为了找一份Python实习，我用爬虫收集数据

MyBatis的收集数据和将数据转发到页面

form表单收集数据提交和回显数据

Java 8 (5) Stream 流 - 收集数据

java8实战五:用流收集数据

Java 流的高级使用之收集数据

Java 8 学习笔记6——用流收集数据

企业收集数据时，面临的风险和机遇

【Java8实战】使用流收集数据

使用Azure Monitor从Azure VM收集数据

Java8用流收集数据

[统计学笔记二] 收集数据

sqoop+mysql+hive收集数据&例子

Python自动采集数据简单操作

八爪鱼分页列表收集数据并将点击跳转收集详情页信息

数据挖掘1：用于从Internet收集数据的数据挖掘工具和技术

vue指令v-model(双向数据绑定)自动收集数据

大数据学习——实现多agent的串联，收集数据到HDFS中

大数据菜鸟实战一：使用flume收集数据到KafKa

A股数据分析之收集数据：公司详细信息

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)