向HIVE导入windows平台(dos类型)的日志 - 代码天地

向HIVE导入windows平台(dos类型)的日志

其他 2018-07-17 09:20:40 阅读次数: 0

把windows的日志复制到linux目录下, 可以先用file,head,tail等命令查看文件概况.

使用dos2unix命令将文件转成unix格式

由于HIVE的时间类型只支持timestamp(hive中timestamp的格式是"YYYY-MM-DD HH:MM:SS"), 所以我们要把日志中的时间列转成timestamp

这里我们使用awk命令(原始时间格式: 2014-02-01_14:09:34.000000):

head sample_data.txt | awk 'BEGIN{FS=",";OFS=","} {gsub(/[-:]/," ",$6);gsub(/[-:_]/," ",$7);print $1,$2,$3,$4,$5,strftime("%Y-%m-%d %H:%M:%S",mktime(substr($6,1,19)))}'

这里使用了awk命令的内置函数 gsub, substr和mktime. 注意gsub的返回值不是改完的以后的字符串, 而是匹配了几次,改了几个字符这样的值, 改动已经直接应用到列上了

到这里可能碰到的一个问题是日志文件太大, 一个解决办法是用 wc+split

wc -l file.txt #获取文件行数

#分割文件,每个文件三十万行,分割后的文件名字前缀为file,-d表示后缀使用数字,-a 2表示后缀有两位
split -l 300000 file.txt file -d -a 2

分割后的文件名字如: file00,file01,.....

再对这些子文件使用awk命令即可.

使用hadoop fs -put 命令把文件放入dfs中, 使用hive的load data inpath命令导入数据进表.

或者使用hive的load data local inpath直接把awk处理后的文件导入hive的表.

猜你喜欢

转载自blog.csdn.net/rav009/article/details/80320022

向HIVE导入windows平台(dos类型)的日志

mariadb审计日志导入 hive

sqoop使用，从hive向oracle导入数据

向Hive中导入数据的方式

Hive复杂类型的导入

ELK 日志平台 For Windows

Windows中DOS编译的工程导入Eclipse编译的设置

sqoop mysql导入hive 数值类型变成null的问题分析

Windows 平台搭建 ASF 挂卡【新手向】

Windows登录类型及安全日志解析

关于Java程序向Hive导入数据的问题解决方法

Hive操作之向分区表中导入数据的语义错误

Windows平台的数据类型讲解（转）

windows下dos窗口实现持续ping显示时间保存至日志

windows 中dos命令

【转载】windows dos命令

windows DOS 命令大全

windows dos处理任务

windows常用dos命令

DOS命令（windows）

Windows的DOS命令基础

Windows dos命令简介

Windows常用的DOS命令

windows dos命令

DOS：Windows And Linux

windows dos删除进程

Windows的dos命令

Windows dos bat Index

Windows 常用的 DOS 命令

【Windows】常用DOS命令

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)