端午快到了！去哪里最好玩？人最少？提前用Python分析一波！ - 代码天地

端午快到了！去哪里最好玩？人最少？提前用Python分析一波！

其他 2018-06-13 14:32:50 阅读次数: 2

经过一番尝试，我们成功找到了请求返回的真实url和关键参数，这里返回的是json格式的数据，里面包含了一个html文本。

3.正式爬取数据

总体思路是爬取索引页中每一个行程的发起人和详情页url，之后进入详情页抓取出发时间、历史、目的地、出发城市、希望人数以及报名人员情况等数据，每个行程的索引页数据和详情页数据合并后作为该行程的完整数据进行存储。以下是爬虫程序的总入口:

所以，我们必须先对获取到的数据进行清洗，以期为正式的数据分析奠定基础。

1.规范格式

首先对历时、希望人数、报名人数(女)、报名人数(男)这几项数据进行清洗，仅保留数字部分;其次对出发是按、出发地点相关数据进行情况，取到“:”及前面的内容。感谢pandas.Series.str方法，使我们可以非常简单地完成上述工作，功能函数如下:

only_num(self, col_list):去除数据中的非数字部分。

no_colon(self, col_list):去除数据中的“:”及其前面的内容。

1.男女比例

首先对参与出行计划的人员性别进行分析，利用dataframe的sum()和groupby().count()方法可以很容易获得行程发布者和参与者的性别分布:

从图中可以看出，发起人以女性居多，约占总数的60%，而参与者刚好相反，男性比例约为60%，估计是女同胞们更擅长精心策划行程，而男同胞们大多比较“懒”吧~

2.出发时间

这里我们首先用dataframen的groupby()方法，以“出行时间”为关键字对数据进行分组，分别统计每天的行程数量和参与者数量，然后画出折线图。

进群：125240963 即可获取源码哦！

猜你喜欢

转载自www.cnblogs.com/PY147/p/9177576.html

端午快到了！去哪里最好玩？人最少？提前用Python分析一波！

七夕快到了，教你用python去表白！

EDG夺冠，用Python分析一波：粉丝都炸锅了

端午节到了，用Python画一个粽子吧！

嵌入式与物联网的关系还是挺复杂的，去同存异分析一波

看到了来支持一波

端午节又一波赠书福利！【第10期赠书】

竟翻出高三用C语言写的贪吃蛇，分析一波！

Python书单推荐一波

终于我还是没忍住，用Python爬了一波女神

2018年苏州房价都快超过上海了，python技术实践分析一波！

python爬取前程无忧分析一波机械职位信息

火爆全网的《鱿鱼游戏》你看了吗？Python来全面分析一波！

程序员是这样学习【中药学】知识的，先用python采集分析一波

再来一波

世界杯快到了，看我用Python爬虫实现（伪）球迷速成！

递归——劳动节快到了，用Python绘制三棵小树

母亲节快到了，用Python给老妈写个祝福小程序吧~

国庆节快到了，用 Python 给自己制作国旗头像，其实很简单。

也来分析一波12306刷票软件(一)

七夕快到了，用SwiftUI做一个表达爱意的心形动画

11.11快到了幽默一下

迎难而上ArrayList，源码分析走一波

迎难而上ArrayList，源码分析走一波

互联网发展新篇章下一波红利在哪里？

快到春节了，用 Python 实现一场烟花秀

最近手头有点紧，于是用Python来冲一波股票...

清明节快到了，车辆尾号限行规则提前看！一文带你了解全国各地的尾号限行规则

来来来,写一波博客,python的循环

搜集一波python开发相关的职业要求

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)