小项目里一些之前没讲过的 - 代码天地

小项目里一些之前没讲过的

编程语言 2018-11-16 10:00:45 阅读次数: 0

1.欲知一串url的意思，可以搜urldecode

2.mysql文本文件想执行，在mysql里source /home/hadoop/data/product_info.sql;

3.jps -m可以看具体跑的jar

4.get_json_object
这样的数据1 product1 {"product_status":1}
取json里的值 get_json_object(json_txt,path) json_txt是第三个字段extend_info,path是’product_status’，前面要加$.，不然取出的会是null.

性能低，慎用。
自定义解析JSON的UDF函数 <== 使用Java开发Hive的UDF函数来搞定

5.row_number函数
写在select里

row_number() over(partition by area order by click_count desc) rank

row_number 用于分组排序，partition这个后面是按什么分组，order by 按什么排序，默认降序，rank是分组的别名
另rank=3，相当于取各组前三个。

join/group by/row_number 容易产生数据倾斜。

6.hive 脚本shell

不需要进入hive，在控制台就可执行，在shell文件里用这个

hive -e

7.指定时间执行一个shell脚本
crontab命令

crontab -l #查看你的任务
crontab-e#编辑你的任务
crontab-r#删除用户的crontab的内容

启动cron进程的方法：/etc/init.d/crond start
开机就启动cron进程的设置命令：chkconfig --add crond

8.reduce task

这个数量要严格控制，不能过大、不能过小，有多少reduce，产生多少个文件。

为什么hadoop不怕文件大，怕小文件多？
元数据记录在namenode，大文件和小文件元数据差不多。

猜你喜欢

转载自blog.csdn.net/qq_36459386/article/details/84134386

小项目里一些之前没讲过的

记录Spring Boot小项目的一些坑

简述FPGA项目之前的一些事

之前的一些内容

Qt配置opencv及使用qt一些相关知识，并测试一个小项目

Angular 项目里使用 scss 文件的一些技巧

实操过的一些网赚小项目，任何人都能赚到钱

一些有的没的

之前搭建的jenkins的一些笔记

之前学习的一些总结

开始之前的一些闲聊

Elasticsearch之前整理的一些知识

在公众号里增加一些好玩的东西，基于关键词查数字货币和之前的文章合集

当时自己写了一个小项目引入了比较完整的依赖和一些配置文件

项目开发里遇到的一些统计分析、超限率等的一些sql

一个spring mvc + mybatis项目里的一些问题

java里的一些异常

JavaScript里关于this一些的事情

WPF里的一些Effect特效

Linux里检查的一些目录！

Java里Finally的一些细节

Java集合里的一些“坑”

jsp里的一些代码

js里的一些知识

SpringBoot里的一些注解

类里的一些特性

Assimp里的一些知识（1）

Assimp里的一些知识（2）

VSLAM里的一些细节

python里的一些代码

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

周排行

《Python 编程-从入门到实践》11-1~11-3

关于Numpy+TensorFlow+PyTorch构造NN的总结

【原创达人】制作WINPE启动盘心得

英文图片文字识别（提取）

2022cma看片网站给一个你懂的

二叉搜索树的实现（BST）（插入+删除+查找+各种遍历+高度）

搬家通知博文地址(将博客搬到CSDN)

asfd

解决错误：MISCONF Redis is configured to save RDB snapshots, but is currently not able to persist on disk

如何注册微信个人小程序

每日归档

更多

2024-06-08(0)

2024-06-07(0)

2024-06-06(0)

2024-06-05(0)

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)