1)hadoop必须配置成伪分布模式或者集群模式
2)必须启动hadoop
hive的数据仓库路径不是本机文件系统路径,而是hdfs的路径
<property> <name>hive.metastore.warehouse.dir</name> <value>/home/hadoop/hive/warehouse</value> <description>location of default database for the warehouse</description> </property>
创建表
create table visit_record(code string, created_at string, phone string, ip string) row format delimited fields terminated by ' ';
向hive数据仓库中加载数据
load data local inpath '/home/hadoop/hive.txt' into table visit_record;
这里的inpath是本机文件系统路径
采用mysql存储metadata
hive-site.xml文件添加如下配置:
<property> <name>hive.metastore.local</name> <value>true</value> </property> <property> <name>javax.jdo.option.ConnectionURL</name> <value> jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true </value> </property> <property> <name>javax.jdo.option.ConnectionDriverName</name> <value>com.mysql.jdbc.Driver</value> </property> <property> <name>javax.jdo.option.ConnectionUserName</name> <value>这里是mysql的用户名</value> </property> <property> <name>javax.jdo.option.ConnectionPassword</name> <value>这里是mysql的密码</value> </property>
把mysql的java版本的jdbc驱动复制到hive的Lib目录下,启动hive。
当输入show tables;没有报错时,配置成功。登录到mysql查看是否创建了
名为hive的数据库。