2021年广东省大数据技术与应用技能大赛 真题测试数据

2021年广东省大数据技术与应用技能大赛 真题测试数据

前面两章讲过关于2021年广东省专业技能大赛——大数据技术与应用 真题题目及解析:

本章主要写的是对于大数据技术与应用这块当中的任务三《数据清洗与分析》,对于前面两章如果有认真看的小伙伴,应该可以大概写出不少的代码了。
但对于数据缺少可能部分小伙伴不知道如何下手,一下提供两种数据,大致涵盖了前面两章任务三所有任务需要用到的字段等,可以试着对下面的两种数据进行清洗和分析,加强自己的能力。

第一个:test.txt

id|name|startTime|endTime|queshi|hotel_name|hotel_province|OTA
1|hh|1998-9-12 12:1:00|2001-9-11||jiudian|gd|2012-8-12
2|aa|1999/9-22|2003-9-11||jiudian|sc|2018-9-12
3|hh|2001/9-19 9|2019-3-12|hh|gd|2019-11-22
4|aa|1999/9-22|2003-9-11||jiudian|sc|2018-9-12

第二个:demo.txt

id|创建时间|fro时间|seq|间夜|省份|酒店名称
1|2020/2/3|2020-7-23 00:22:32|25df|55|广东|aa
2|2020-2-22||25df|23|广东|bb
3|2020-3-23 00:33:22|2020/3/2|23df|2|湖南|cc
4|2021-7-23|2019-12-3|24df|33|四川|dd
5||2011-2-5|2018-3-4|22df|53|四川|dd
6|2018-8-5|2019/2/3|21df|22|北京|aa
7|2014-5-3|2015-6-3|22df|36|上海|bb
8|2016-3-7|2018-6-2|23df|86|广东|cc
9|2017-6-8|2019/5/3|25df|12|西藏|dd
10|2016-2-3|2018-4-5|22df|1|新疆|dd
11|1234-55-55|55-55-55|22df|3|广州|2|6|ee

直接复制粘贴到txt文件中即可利用scala开始数据清洗和分析。

猜你喜欢

转载自blog.csdn.net/white_mvlog/article/details/119754597