SolrJ的javabin格式分析

Solr中对于返回数据格式有xml、json、javabin等等,其中当传入参数wt=javabin时可以直接返回solr自定义序列化的javabin二进制流。

Solr对对于对象的序列化基本采用以下格式(对于熟悉lucene的同学来说可能更容易理解):

version+[tag+value]

第一个byte表示Version,必须为“1”。下面就是对象的定义了。tag为一个字节,前三位表示tag的名称,后五位表示数据长度。Solr的tag定义如下:

NULL = 0,

BOOL_TRUE = 1,

BOOL_FALSE = 2,

BYTE = 3,

SHORT = 4,

DOUBLE = 5,

INT = 6,

LONG = 7,

FLOAT = 8,

DATE = 9,

MAP = 10,

SOLRDOC = 11,

SOLRDOCLST = 12,

BYTEARR = 13,

ITERATOR = 14,

END = 15,

TAG_AND_LEN = (byte)(1 << 5),

STR = (byte)(1 << 5),

SINT = (byte)(2 << 5),

SLONG = (byte)(3 << 5),

ARR = (byte)(4 << 5), //

ORDERED_MAP = (byte)(5 << 5),

NAMED_LST = (byte)(6 << 5),

EXTERN_STRING = (byte)(7 << 5);

对于Solr的序列化了解以后,我们就可以写代码,对Solr的javabin二进制格式数据进行解析了。

猜你喜欢

转载自sheng.iteye.com/blog/858400
今日推荐