基于大数据挖掘的旅游分析

收藏关注不迷路


前言

  随着国民经济的不断进步与发展,旅游逐渐成为了人们休闲娱乐的主要形式。大学生群体作为一个特殊的消费群体,其在旅游决策时的消费心理受到旅游行业从业者的广泛重视。与此同时,互联网的迅速发展,促使了网络信息的大爆发,大量的大数据随处可见,如何将这些大数据转化为有用的信息和知识,必须借助大数据挖掘技术。随着云计算、大数据等新技术的快速发展,旅游大数据引起了学者们的关注。介绍了大数据的概念和旅游大数据的发展要求,概述了数据挖掘的一般技术和旅游大数据的挖掘技术,最后提出了数据挖掘在旅游行业的应用方向。

关键词:大数据挖掘;旅游;决策

一、 绪论

目的

  本研究分析影响大学生出行决策的因素,利用问卷调查收集的大数据作为大数据分析的来源,并结合大数据挖掘技术的决策树和随机森林进行心理理解。了解大学生出行及出行决策过程,以及影响大学生出行决策的主要影响因素,并在其研究结果之上进行分析、讨论,希望能够为旅游行业从业者和经营者提供有价值的参考。

研究工具与方法

  本文将使用决策树及随机森林两种算法作为基础算法,并以此来确定大学生旅游决策影响因素的影响大小。决策树是使用二叉树图来表示处理逻辑的工具。处理的逻辑要求可以直观、清晰地表达出来。特别适用于判断因素较少、逻辑组合关系不复杂的情况。随机森林是具有多棵决策树的分类器,输出类由它从每棵树输出的类模式决定。

二、大数据挖掘概述

2.2 大数据挖掘方法

  大数据挖掘分为引导式大数据挖掘和非引导式大数据挖掘。引导式大数据挖掘是使用可用的大数据来构建描述特定属性的模型。无向大数据挖掘正在寻找所有属性之间的某种关系。具体来说,分类、评估和预测属于引导式大数据挖掘,关联规则和聚类属于非引导式大数据挖掘。(1)分类首先从大数据中选择一个分类的训练集,在训练集上使用大数据挖掘技术建立分类模型,然后使用分类模型对未分类的大数据进行分类。(2)评价评价类似于分类,但评价的最终产物是一个连续值,评价量没有预先确定。评估可以作为分类的准备。(3)通过分类或评价训练得到模型的模型,通过分类或评价进行预测;如果该模型对一组测试样本的准确率较高,则该模型可用于未知变量;预测一个新的样本。(4)相关分组或关联规则,其目的是发现总是一起发生的事情。(5)聚类通过自动查找和设置分组规则,通过确定样本之间的相似性将相似样本划分为聚类[7]。

2.3 大数据挖掘流程

  大数据挖掘是从不完整、嘈杂、模糊和随机的大量大数据中提取隐藏的、未知的但可能有用的信息和知识的过程,有以下基本流程:
(1)明确目标,在实施大数据挖掘之前,须明确通过大数据挖掘去解决什么样的问题。
(2)大数据搜集,当明确了目标后,需要去搜集大数据,搜集的大数据即可以影响到这些问题的解决办法,大数据搜集决定了后期工作进程的顺利程度。
(3)大数据清洗,搜集到的大数据来源是复杂混乱的,必须保证大数据的“干净”,因为大数据的质量高低将会影响最终结果的准确性。
(4)构建模型,在保证大数据“干净”的前提下,需要考虑以什么样的模型能进行建模,以确保更好的解决问题,。
(5)模型评估,即从已建立的模型中选择最佳模型的主要目的,是为了确保最佳模型更好地反映大数据的真实性。
(6)应用部署,把从大数据挖掘中得到的规律运用到实际问题中去。

三、大数据挖掘技术在智慧旅游中的应用

3.3 智慧旅游系统中的协同过滤——推荐相似项

  在大数据时代,游客复杂的个性化需求和大数据的处理,使我们的旅游业进入了智慧旅游时代。智慧旅游是对整个旅游系统进行完善和提升,以满足游客的需求,从简单的旅游体验到不同的需求。推荐相似物品的问题主要从寻找具有大交集的集合的问题开始,在寻找过程中主要使用最小散列技术。智慧旅游的发展是一种创新,它在云计算环境下根据游客的个性指标做出有效的推荐,这是挖掘复杂网络数据的有效算法。为了解决这个问题,已经开发了地理感应散列技术,可以将搜索范围集中在可能相似的项目对上。在协同过滤中,系统向用户推荐具有相似兴趣的用户喜欢的东西。它首先找到一组可能的相似文档的候选对,然后基于这个集合,找到实际的相似文档。对智慧旅游系统中定制旅游云服务的选择进行协同过滤,通过技术手段为这些信息数据资源构建基于云平台的枢纽,进行信息组织和数据计算。智慧旅游控制中心提取复杂网络动态增长信息,进行大数据分析,通过移动互联网将分析结果可视化,为游客提供精准的旅游信息。在模糊项目的协同过滤-推荐过程中,选择最小哈希签名长度,并检查每个候选对的签名,以确定一致性比是否高于某个值。智慧旅游系统采用算法组合实现个性化推荐。

3.4 智慧旅游系统中网络数据流挖掘

  智慧旅游系统的数据是流动的,是由旅游特点决定的。预测复杂网络中信息传播过程的方法主要是结合信息流信息进行挖掘。由于复杂网络的性质,在数据挖掘过程中,我们更感兴趣的是数据的动态属性,即信息流的属性。数据流挖掘意味着您可以在真正需要时使用任何数据。当发现有数据流来时,需要及时处理数据。否则,数据将丢失。智慧旅游系统通过云计算、物联网等技术手段,及时捕捉所有信息流,进行精准数据分析,提取有用样本,向智慧旅游系统控制中心提供指挥信息。一般来说,流处理的常用方法是选择或过滤。换句话说,您希望流只接受一组满足特定条件的元组。允许的元组被流式传输到其他进程,而其他元组被忽略。在复杂的网络中,智慧旅游处理的信息不仅包括结构信息,还包括属性信息和信息流,因此不仅需要研究静态属性,还需要研究动态属性。传统的网络挖掘方法甚至无法描述或预测复杂网络中信息分布的动态过程。在构建智慧旅游系统时,将复杂网络的数据挖掘系统应用于数据处理。通过构建可靠、可靠、高效的数据挖掘机制,可以预测数据流处理中信息传播过程中的问题。整个智慧旅游是一个以旅游为导向的人流系统。

四、结论

  近年来,随着时代经济的飞速发展和科技的飞速发展,旅游业逐渐积极发展,逐渐引领时代发展潮流。同时,大数据时代的到来也是当今媒体的热门话题之一。旅游大数据在旅游业中的应用一直是旅游业研究的重点之一。本文在研究旅游大数据及其在挖掘和旅游行业中的应用的同时,首先对大数据和旅游数据挖掘进行了概述,分析了旅游大数据和挖掘在旅游行业中的必要性。最后对旅游大数据与挖掘在旅游行业的应用方向进行了探讨和总结。
  随着时代经济的高速发展,旅游大数据和挖掘技术也在蓬勃发展,当前旅游市场的竞争也越来越激烈,为了让旅游企业有更好的市场发展前景,现代旅游企业必须提高旅游大数据的信息处理能力,进行有效的信息挖掘,获取有价值的信息,争取更多的市场发展机会,合理配置旅游资源相关系统,不断寻找和组合潜在客户。根据潜在客户的需求,提供定制化的旅游服务,全面促进旅游业的快速发展。

目录

目录
摘要 II
Abstract III
第一章 绪论 1
1.1 研究背景 1
1.2 研究目的 1
1.3 国内研究现状 1
1.4 研究工具与方法 2
第二章 大数据挖掘概述 3
2.1 大数据挖掘定义 3
2.2 大数据挖掘方法 3
2.3 大数据挖掘流程 3
第三章 大数据挖掘技术在智慧旅游中的应用 5
3.1 旅游大数据及挖掘在旅游业应用的必要性 5
3.2 智慧旅游系统中结构和属性信息的数据挖掘 5
3.3 智慧旅游系统中的协同过滤——推荐相似项 6
3.4 智慧旅游系统中网络数据流挖掘 7
第四章 大数据挖掘在智慧旅游中的展望 8
结论 9
参考文献 10
致谢 12

猜你喜欢

转载自blog.csdn.net/QQ2743785109/article/details/134040377
今日推荐