1.学习大数据首先我们要先安装好虚拟机,以配合hadoop的执行。列如,windows在运行hadoop时,需要安装Cygwin等软件。
我们这里选择Linux作为系统平台,来演示在计算机上如何安装hadoop,运行程序并得到最终结果。
2.Linux发行版的选择更倾向使用企业级的,稳定的操作系统作为实验的系统环境。考虑到易用性和免费性我们一般排除OpenSUSE和RedHat等发行版
最终选择Ubuntu左面版作为操作系统
3.hadoop基本安装配置主要包括一下5个步骤:
(1)创建hadoop用户
(2)安装java
(3)设置ssh登录权限
(4)单机安装配置
(5)伪分布式安装配置