hadoop的数据序列化类型

hadoop的数据序列化类型
        IntWritable,FloatWritable,LongWritable,DoubleWritable,Text,
        BooleanWritable,ByteWritable,MapWritable,ArrayWritable

    JAVA的数据类型
        int,float,long,double,string,boolean,byte,map,array

    为什么要序列化?
        序列化就是把内存当中的对象,转换成字节序列比便于存储和网络传输
            存储“活的对象”
            hadoop序列化实现了hadoop的上传和下载
            java序列化实现了网络传输
        反序列化就是将收到的字节序列或者硬盘的持久化数据,转换成内存中的对象。

    java的序列化->Serializable
    为什么不用java提供的序列化接口?
        java的序列化是一个重量级的序列化框架,一个对象被序列化后会附带很多额外的信息(校验信息,header,继承体系等)。
        不便于在网络中的高效传输,所以hadoop开发了一套序列化机制(Writable),精简/高效。

    为什么序列化在hadoop中很重要?
        hadoop通信是通过远程调用(rpc)实现的,需要进行序列化


    特点:
        1)紧凑
        2)快速
        3)可拓展
        4)互操作

猜你喜欢

转载自blog.csdn.net/weixin_42898914/article/details/84865939