Neo4j的存储结构

Neo4j作为图形数据库,有其独特的数据存储结构。
数据存储主要分为节点、关系、节点或关系上属性这三类数据存储,这些数据也可以通过Lucene进行存储检索。





 

 

一个节点共占9个byte,,格式

 in_use(byte)+next_rel_id(int)+next_prop_id(int)

节点是否可用+最近一个关系的Id(-1表示无)+最近一个属性的Id(-1表示无)

通过每个节点Id号,很容易通过计算偏移量获取这个节点的相关数据。

[javascript] view plain copy
 
print ?
  1. Node[0,used=true,rel=9,prop=-1]  
  2. Node[1,used=true,rel=1,prop=0]  
  3. Node[2,used=true,rel=2,prop=2]  
  4. Node[3,used=true,rel=2,prop=4]  
  5. Node[4,used=true,rel=4,prop=6]  
  6. Node[5,used=true,rel=5,prop=8]  
  7. Node[6,used=true,rel=5,prop=10]  
  8. Node[7,used=true,rel=7,prop=12]  
  9. Node[8,used=true,rel=8,prop=14]  
  10. Node[9,used=true,rel=8,prop=16]  
  11. Node[10,used=true,rel=10,prop=18]  
  12. Node[11,used=true,rel=11,prop=20]  
  13. Node[12,used=true,rel=11,prop=22]  
 Node[0,used=true,rel=9,prop=-1]
 Node[1,used=true,rel=1,prop=0]
 Node[2,used=true,rel=2,prop=2]
 Node[3,used=true,rel=2,prop=4]
 Node[4,used=true,rel=4,prop=6]
 Node[5,used=true,rel=5,prop=8]
 Node[6,used=true,rel=5,prop=10]
 Node[7,used=true,rel=7,prop=12]
 Node[8,used=true,rel=8,prop=14]
 Node[9,used=true,rel=8,prop=16]
 Node[10,used=true,rel=10,prop=18]
 Node[11,used=true,rel=11,prop=20]
 Node[12,used=true,rel=11,prop=22]



一个关系占33个byte,格式

directed|in_use(byte)+first_node(int)+second_node(int)+rel_type(int)+ first_prev_rel_id(int)+first_next_rel_id+second_prev_rel_id(int)+second_next_rel_id+next_prop_id(int)

是否可用+关系的头节点+关系的尾节点+关系类型+头节点的前一个关系Id+头节点的后一个关系id+尾节点的前一个关系Id+尾节点的后一个关系Id+关系的最近属性Id

其中节点的前一个或后一个关系Id,是怎么算出来的?

如果这个节点在添加关系过程中,如果是最初添加的则没有尾关系Id(-1表示),如果是最后一个关系则没有前一个关系Id(-1表示),中间添加的关系都应该有前一个和后一个关系Id,最终通过这些关系Id形成节点的关系列表。

[javascript] view plain copy
 
print ?
  1. Relationship[0,used=true,source=1,target=0,type=0,sPrev=1,sNext=-1,tPrev=3,tNext=-1,prop=1]  
  2. Relationship[1,used=true,source=2,target=1,type=1,sPrev=2,sNext=-1,tPrev=-1,tNext=0,prop=3]  
  3. Relationship[2,used=true,source=3,target=2,type=2,sPrev=-1,sNext=-1,tPrev=-1,tNext=1,prop=5]  
  4. Relationship[3,used=true,source=4,target=0,type=0,sPrev=4,sNext=-1,tPrev=6,tNext=0,prop=7]  
  5. Relationship[4,used=true,source=5,target=4,type=1,sPrev=5,sNext=-1,tPrev=-1,tNext=3,prop=9]  
  6. Relationship[5,used=true,source=6,target=5,type=2,sPrev=-1,sNext=-1,tPrev=-1,tNext=4,prop=11]  
  7. Relationship[6,used=true,source=7,target=0,type=0,sPrev=7,sNext=-1,tPrev=9,tNext=3,prop=13]  
  8. Relationship[7,used=true,source=8,target=7,type=1,sPrev=8,sNext=-1,tPrev=-1,tNext=6,prop=15]  
  9. Relationship[8,used=true,source=9,target=8,type=2,sPrev=-1,sNext=-1,tPrev=-1,tNext=7,prop=17]  
  10. Relationship[9,used=true,source=10,target=0,type=0,sPrev=10,sNext=-1,tPrev=-1,tNext=6,prop=19]  
  11. Relationship[10,used=true,source=11,target=10,type=1,sPrev=11,sNext=-1,tPrev=-1,tNext=9,prop=21]  
  12. Relationship[11,used=true,source=12,target=11,type=2,sPrev=-1,sNext=-1,tPrev=-1,tNext=10,prop=23]  
Relationship[0,used=true,source=1,target=0,type=0,sPrev=1,sNext=-1,tPrev=3,tNext=-1,prop=1]
Relationship[1,used=true,source=2,target=1,type=1,sPrev=2,sNext=-1,tPrev=-1,tNext=0,prop=3]
Relationship[2,used=true,source=3,target=2,type=2,sPrev=-1,sNext=-1,tPrev=-1,tNext=1,prop=5]
Relationship[3,used=true,source=4,target=0,type=0,sPrev=4,sNext=-1,tPrev=6,tNext=0,prop=7]
Relationship[4,used=true,source=5,target=4,type=1,sPrev=5,sNext=-1,tPrev=-1,tNext=3,prop=9]
Relationship[5,used=true,source=6,target=5,type=2,sPrev=-1,sNext=-1,tPrev=-1,tNext=4,prop=11]
Relationship[6,used=true,source=7,target=0,type=0,sPrev=7,sNext=-1,tPrev=9,tNext=3,prop=13]
Relationship[7,used=true,source=8,target=7,type=1,sPrev=8,sNext=-1,tPrev=-1,tNext=6,prop=15]
Relationship[8,used=true,source=9,target=8,type=2,sPrev=-1,sNext=-1,tPrev=-1,tNext=7,prop=17]
Relationship[9,used=true,source=10,target=0,type=0,sPrev=10,sNext=-1,tPrev=-1,tNext=6,prop=19]
Relationship[10,used=true,source=11,target=10,type=1,sPrev=11,sNext=-1,tPrev=-1,tNext=9,prop=21]
Relationship[11,used=true,source=12,target=11,type=2,sPrev=-1,sNext=-1,tPrev=-1,tNext=10,prop=23]



一个属性默认占41个byte,格式

 1/*next and prev high bits*/ +4/*next*/  + 4/*prev*/  + DEFAULT_PAYLOAD_SIZE /*property blocks*/;

是否可用+前一个属性Id+后一个属性Id+属性块32个字节

PropertyRecords形成一个双向链表,每一个持有一个或多个PropertyBlocks的实际的属性键/值对。因为PropertyBlocks长度是可变的,一个完整的PropertyRecord可以只是一个PropertyBlock。

属性块格式:属性类型(8B)+属性值(如果非基础类型占8B)

属性键与属性值分别存储在不同的文件中。

属性记录属于动态存储格式。

为什么属性块要32个字节,还得慢慢看!

32个字节只是系统默认的大小。

一个节点如果有多个属性,一个属性记录集无法存下则通过下一个属性Id存储,最终通过上下属性Id完成列表连接。

DEFAULT_PAYLOAD_SIZE 是动态可变的,基础类型占一个8B,动态类型是类型占8B,值占8B,

如果属性值大于默认长度,则需要动态存储,类似数据库BLOB字段的存储。

Neo4j通过属性的header 计算属性的类型与属性所占字节数,仍不知道怎么计算出????

PropertyStore.encodeValue方法对属性数据进行编码处理。

LongerShortString对字符、数字等短字符进行编码,是否DEFAULT_PAYLOAD_SIZE可以存储下当前属性值。

对长字符或动态属性数据则通过动态方式存储。

动态存储格式:(in_use+next high)(1 byte)+nr_of_bytes(3 bytes)+next_block(int)

是否有效+字符长度+下一个块Id

属性值的加载都是延迟加载,除非前端需要获取属性值才会读取属性值,否则不会加载属性值。

通过生成的neo4j文件,输出节点、关系、属性了解他们之间的关系,数据存储结构的关系。

[javascript] view plain copy
 
print ?
  1. Node[3,used=true,rel=2,prop=10]  
  2. header:1426063367 numBlocks:[1]  
  3. PropertyBlock[INT,key=7,value=5]  
  4. Property[10,used=true,prev=-1,next=9,PropertyBlock[INT,key=7,value=5]]  
  5. header:956301315 numBlocks:[1]  
  6. PropertyBlock[STRING,key=3,firstDynamic=3]  
  7. header:973078532 numBlocks:[1]  
  8. PropertyBlock[ARRAY,key=4,firstDynamic=3]  
  9. header:889192453 numBlocks:[1]  
  10. PropertyBlock[INT,key=5,value=3]  
  11. header:1157627910 numBlocks:[1]  
  12. PropertyBlock[INT,key=6,value=4]  
  13. Property[9,used=true,prev=10,next=8,PropertyBlock[STRING,key=3,firstDynamic=3],PropertyBlock[ARRAY,key=4,firstDynamic=3],PropertyBlock[INT,key=5,value=3],  
Node[3,used=true,rel=2,prop=10]
header:1426063367 numBlocks:[1]
PropertyBlock[INT,key=7,value=5]
Property[10,used=true,prev=-1,next=9,PropertyBlock[INT,key=7,value=5]]
header:956301315 numBlocks:[1]
PropertyBlock[STRING,key=3,firstDynamic=3]
header:973078532 numBlocks:[1]
PropertyBlock[ARRAY,key=4,firstDynamic=3]
header:889192453 numBlocks:[1]
PropertyBlock[INT,key=5,value=3]
header:1157627910 numBlocks:[1]
PropertyBlock[INT,key=6,value=4]
Property[9,used=true,prev=10,next=8,PropertyBlock[STRING,key=3,firstDynamic=3],PropertyBlock[ARRAY,key=4,firstDynamic=3],PropertyBlock[INT,key=5,value=3],
[javascript] view plain copy
 
print ?
  1. DynamicRecord[3,used=true,light=true(99),type=0,data=null,next=-1]  
  2. DynamicRecord[3,used=true,light=true(17),type=0,data=null,next=-1]  
DynamicRecord[3,used=true,light=true(99),type=0,data=null,next=-1]
DynamicRecord[3,used=true,light=true(17),type=0,data=null,next=-1]
[javascript] view plain copy
 
print ?
  1. PropertyBlock[INT,key=6,value=4]]  
  2. nextProp4294967295  
  3. header:-3348670910683938816 numBlocks:[2]  
  4. value block:1618  
  5. PropertyBlock[SHORT_STRING,key=0,value=Cypher]  
  6. header:371083010969174017 numBlocks:[1]  
  7. PropertyBlock[SHORT_STRING,key=1,value=test]  
  8. header:308431181316098 numBlocks:[1]  
  9. PropertyBlock[SHORT_STRING,key=2,value=QQ]  
  10. Property[8,used=true,prev=9,next=-1,PropertyBlock[SHORT_STRING,key=0,value=Cypher],PropertyBlock[SHORT_STRING,key=1,value=test],PropertyBlock[SHORT_STRING,key=2,value=QQ]]  
PropertyBlock[INT,key=6,value=4]]
nextProp4294967295
header:-3348670910683938816 numBlocks:[2]
value block:1618
PropertyBlock[SHORT_STRING,key=0,value=Cypher]
header:371083010969174017 numBlocks:[1]
PropertyBlock[SHORT_STRING,key=1,value=test]
header:308431181316098 numBlocks:[1]
PropertyBlock[SHORT_STRING,key=2,value=QQ]
Property[8,used=true,prev=9,next=-1,PropertyBlock[SHORT_STRING,key=0,value=Cypher],PropertyBlock[SHORT_STRING,key=1,value=test],PropertyBlock[SHORT_STRING,key=2,value=QQ]]
[javascript] view plain copy
 
print ?
  1. Node[0,used=true,rel=9,prop=-1]  
  2. Node[1,used=true,rel=1,prop=0]  
  3. Property[0,used=true,prev=-1,next=-1,PropertyBlock[SHORT_STRING,key=0,value=Neo122333],PropertyBlock[SHORT_STRING,key=1,value=QQ],PropertyBlock[INT,key=2,value=100]]  
  4. Node[2,used=true,rel=2,prop=2]  
  5. Property[2,used=true,prev=-1,next=-1,PropertyBlock[SHORT_STRING,key=0,value=Morpheus],PropertyBlock[SHORT_STRING,key=1,value=QQ],PropertyBlock[INT,key=2,value=100]]  
  6. Node[3,used=true,rel=2,prop=4]  
  7. Property[4,used=true,prev=-1,next=-1,PropertyBlock[SHORT_STRING,key=0,value=Cypher],PropertyBlock[SHORT_STRING,key=1,value=QQ],PropertyBlock[INT,key=2,value=100]]  
  8. Node[4,used=true,rel=4,prop=6]  
  9. Property[6,used=true,prev=-1,next=-1,PropertyBlock[SHORT_STRING,key=0,value=Neo122333],PropertyBlock[SHORT_STRING,key=1,value=QQ],PropertyBlock[INT,key=2,value=100]]  
  10. Node[5,used=true,rel=5,prop=8]  
  11. Property[8,used=true,prev=-1,next=-1,PropertyBlock[SHORT_STRING,key=0,value=Morpheus],PropertyBlock[SHORT_STRING,key=1,value=QQ],PropertyBlock[INT,key=2,value=100]]  
  12. Node[6,used=true,rel=5,prop=10]  
  13. Property[10,used=true,prev=-1,next=-1,PropertyBlock[SHORT_STRING,key=0,value=Cypher],PropertyBlock[SHORT_STRING,key=1,value=QQ],PropertyBlock[INT,key=2,value=100]]  
  14. Node[7,used=true,rel=7,prop=12]  
  15. Property[12,used=true,prev=-1,next=-1,PropertyBlock[SHORT_STRING,key=0,value=Neo122333],PropertyBlock[SHORT_STRING,key=1,value=QQ],PropertyBlock[INT,key=2,value=100]]  
  16. Node[8,used=true,rel=8,prop=14]  
  17. Property[14,used=true,prev=-1,next=-1,PropertyBlock[SHORT_STRING,key=0,value=Morpheus],PropertyBlock[SHORT_STRING,key=1,value=QQ],PropertyBlock[INT,key=2,value=100]]  
  18. Node[9,used=true,rel=8,prop=16]  
  19. Property[16,used=true,prev=-1,next=-1,PropertyBlock[SHORT_STRING,key=0,value=Cypher],PropertyBlock[SHORT_STRING,key=1,value=QQ],PropertyBlock[INT,key=2,value=100]]  
  20. Node[10,used=true,rel=10,prop=18]  
  21. Property[18,used=true,prev=-1,next=-1,PropertyBlock[SHORT_STRING,key=0,value=Neo122333],PropertyBlock[SHORT_STRING,key=1,value=QQ],PropertyBlock[INT,key=2,value=100]]  
  22. Node[11,used=true,rel=11,prop=20]  
  23. Property[20,used=true,prev=-1,next=-1,PropertyBlock[SHORT_STRING,key=0,value=Morpheus],PropertyBlock[SHORT_STRING,key=1,value=QQ],PropertyBlock[INT,key=2,value=100]]  
  24. Node[12,used=true,rel=11,prop=22]  
  25. Property[22,used=true,prev=-1,next=-1,PropertyBlock[SHORT_STRING,key=0,value=Cypher],PropertyBlock[SHORT_STRING,key=1,value=QQ],PropertyBlock[INT,key=2,value=100]]  

猜你喜欢

转载自weitao1026.iteye.com/blog/2312389