hive使用mysql作为元数据库时的编码问题

hive的Specified key was too long; max key length is 767 bytes问题解决
解决一: FAILED: Error in metadata: javax.jdo.JDODataStoreException: Error(s) were found while auto-creatingalidating the datastore for classes. The errors are printed in the log, and are attached to this exception.
NestedThrowables:
com.mysql.jdbc.exceptions.jdbc4.MySQLSyntaxErrorException: Specified key was too long; max key length is 767 bytes
FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask
(略去 很多java 提示)
 
是到mysql中的hive数据库里执行 alter database hive character set latin1;改变hive元数据库的字符集,问题就可以解决!

建议:这种方式不好,有的字段应该是 latin1 ,而有的字段应该是 utf8;

解决方法二:hive元数据储存在mysql 字符集utf8 修改
注意:手动在mysql中创建数据库 创建数据库时要指定用 latin1 编码集;个别字段用到utf8编码集 须手动修改。
<property>
  <name>javax.jdo.option.ConnectionURL</name>
  <value>jdbc:mysql://IP:3306/hive?createDatabaseIfNotExist=true&amp;characterEncoding=UTF-8<alue>
  <description>JDBC connect string for a JDBC metastore</description>
</property>
 
表或者字段有中文的时候需要修改hive的元数据库的设置。
以mysql为例子,当mysql的字符集设置成utf8的时候使用hive会有问题
(com.mysql.jdbc.exceptions.jdbc4.MySQLSyntaxErrorException: Specified key was too long; max key length is 767 bytes )
 
所以当hive使用mysql作为元数据库的时候mysql的字符集要设置成latin1   default。
为了保存那些utf8的中文,要将mysql中存储注释的那几个字段的字符集单独修改为utf8。
修改字段注释字符集
alter table COLUMNS modify column COMMENT varchar(256) character set utf8;
修改表注释字符集
alter table TABLE_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;

最后别忘记修改hive的jdbc连接,将字符集修改为utf8,如
javax.jdo.option.ConnectionURL
jdbc:mysql://192.168.0.10:3306/hive?characterEncoding=UTF-8
JDBC connect string for a JDBC metastore 
解决一: FAILED: Error in metadata: javax.jdo.JDODataStoreException: Error(s) were found while auto-creatingalidating the datastore for classes. The errors are printed in the log, and are attached to this exception.
NestedThrowables:
com.mysql.jdbc.exceptions.jdbc4.MySQLSyntaxErrorException: Specified key was too long; max key length is 767 bytes
FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask
(略去 很多java 提示)
 
是到mysql中的hive数据库里执行 alter database hive character set latin1;改变hive元数据库的字符集,问题就可以解决!

建议:这种方式不好,有的字段应该是 latin1 ,而有的字段应该是 utf8;

解决方法二:hive元数据储存在mysql 字符集utf8 修改
注意:手动在mysql中创建数据库 创建数据库时要指定用 latin1 编码集;个别字段用到utf8编码集 须手动修改。
<property>
  <name>javax.jdo.option.ConnectionURL</name>
  <value>jdbc:mysql://IP:3306/hive?createDatabaseIfNotExist=true&amp;characterEncoding=UTF-8<alue>
  <description>JDBC connect string for a JDBC metastore</description>
</property>
 
表或者字段有中文的时候需要修改hive的元数据库的设置。
以mysql为例子,当mysql的字符集设置成utf8的时候使用hive会有问题
(com.mysql.jdbc.exceptions.jdbc4.MySQLSyntaxErrorException: Specified key was too long; max key length is 767 bytes )
 
所以当hive使用mysql作为元数据库的时候mysql的字符集要设置成latin1   default。
为了保存那些utf8的中文,要将mysql中存储注释的那几个字段的字符集单独修改为utf8。
修改字段注释字符集
alter table COLUMNS modify column COMMENT varchar(256) character set utf8;
修改表注释字符集
alter table TABLE_PARAMS modify column PARAM_VALUE varchar(4000) character set utf8;

最后别忘记修改hive的jdbc连接,将字符集修改为utf8,如
javax.jdo.option.ConnectionURL
jdbc:mysql://192.168.0.10:3306/hive?characterEncoding=UTF-8
JDBC connect string for a JDBC metastore 

猜你喜欢

转载自blog.csdn.net/wscrf/article/details/80251096