数据分析和构建大数据分析基础设施的关键环节 Building a BigData Analytics Infrastructure

作者:禅与计算机程序设计艺术

1.简介

2010年,谷歌搜索引擎爆炸性的流量导致其搜索结果无法显示全面而失败,此后数十年的时间里,谷歌始终秉持着让用户获得快速、及时的信息检索体验的使命,致力于提供最好的网页搜索引擎产品,实现其搜索功能的更好升级。如今,谷歌已经成为全球最大的互联网公司之一,占据了整个互联网的半壁江山,但这个互联网公司也存在着巨大的商业价值和长期影响力。随着互联网企业不断产生海量的数据,如何有效的进行数据分析、挖掘和处理成为当下最迫切的商业需求。2014年,亚马逊网站上线了Amazon Web Services (AWS)云计算平台,提供了一系列的大数据分析服务,这些服务可以帮助用户快速分析和理解大数据的价值,并提升用户的决策效率。
在构建一个具有大数据分析能力的系统时,需要考虑三个关键点:数据收集、存储、处理。首先,需要搜集不同渠道(日志、文本、图像、视频等)中的海量数据,通过工具将数据采集到一个中心化的存储平台中。然后,对存储的数据进行清洗、转换、过滤等操作,对数据进行可视化展示,以及按照一定时间窗口或频率进行数据统计,进一步形成可交互的分析报告或图表。最后,利用算法模型对数据进行分析,提取有用的信息,为业务部门提供决策支持。本文将从两个方面介绍数据分析和构建大数据分析基础设施的关键环节。

2.大数据概念和技术术语

2.1 大数据概念

“Big data”这一术语源自于美国计算机科学家威廉·迈克尔·香农,指在过去几十年间从各个角度观察、采集、汇总、储存和分析的数据。它广泛应用于各个领域,包括经济、金融、社会、生物医疗、环境保护、教育、科技、文化

猜你喜欢

转载自blog.csdn.net/universsky2015/article/details/132033805