ElasticSearch常见名词解释

文档元数据

一个文档不只有数据。它还包含了 元数据(metadata)—— 关于文档的信息。三个必须的元数据节点是:

节点

说明

index

文档存储的地方

type

文档代表的对象的类型

id

文档的唯一标识

索引(index)

这里说的索引,是一个名词,一个存储关联数据的地方。实际上,索引只是一个用来指向一个或多个分片(shards)的“逻辑命名空间”。 索引(index)类似于关系型数据库里的“数据库”——它是我们存储和索引关联数据的地方。

事实上,我们的数据被存储和索引在 分片(shards)中,索引只是一个把一个或多个分片分组在一起的逻辑空间。然而,这只是一些内部细节——我们的程序完全不用关心分片。对于我们的程序而言,文档存储在 索引(index)中。剩下的细节由Elasticsearch关心既可。

类型(type) 

在应用中,我们使用对象表示一些“事物”,例如一个用户、一篇博客、一个评论,或者一封邮件。每个对象都属于一个 类(class),这个类定义了属性或与对象关联的数据。 user 类的对象可能包含姓名、性别、年龄和Email地址。      

在关系型数据库中,我们经常将相同类的对象存储在一个表里,因为它们有着相同的结构。同理,在Elasticsearch中,我们使用相同 类型(type)的文档表示相同的“事物”,因为他们的数据结构也是相同的。在ES中的type就相当于关系型数据库中的表。

每个 类型(type)都有自己的映射(mapping)或者结构定义,就像传统数据库表中的列一样。所有类型下的文档被存储在同一个索引下,但是类型的映射(mapping)会告诉Elasticsearch不同的文档如何被索引。 

_type 的名字可以是大写或小写,不能包含下划线或逗号。我们将使用``blog`做为类型名。              

唯一标识(id)

id仅仅是一个字符串,它与 _index 和 _type 组合时,就可以在ELasticsearch中唯一标识一个文档。当创建一个文档,你可以自定义 _id ,也可以让Elasticsearch帮你自动生成。(自动生成ID需要用Post请求)

分片(shard)

一个分片是一个最小级别的工作单元。他只是保存了索引中所有数据的一部分,分片就是一个lucene实例,他本身就是一个完整的搜索引擎。我们的文档存储在分片中,并且在分片中被索引,但应用程序不会直接与分片进行通信,而是直接与索引进行通信。

分片是ElasticSearch在集群中分发数据的关键,把分片想象成数据的容器,文档存储在分片中,然后分片分配到集群中的节点上。当集群扩容或缩小,ES会自动在你的节点间迁移分片,使集群保持平衡。

分片可以是主分片和复制分片。索引中的每个文档属于一个单独的主分片,所以主分片的数量决定了索引最多能存储多少数据。

复制分片只是主分片的一个副本,它可以防止硬件故障导致的数据丢失,同时可以提供读请求,比如搜索或者从别的shard取回文档

当索引创建完成的时候,主分片的数量就固定了,但是复制分片的数量可以随时调整。

文档的索引将首先被存储在主分片中,然后并发复制到对应的复制节点上。这可以确保我们的数据在主节点和复制节点上都可以被检索。理论上讲,随着节点的增加,ES的搜索性能也会随之增加(因为在分片数一定的情况下,节点数越多,每个分片所能分到到硬件资源 内存,CPU等越高。但节点数不大于分片数)。

当然,在同样数量的节点上增加更多的复制分片并不能提高性能,因为这样做的话平均每个分片的所占有的硬件资源就减少了,你需要增加硬件来提高吞吐量。不过这些额外的复制分片使我们有更多的冗余:也就是说在节点充裕的情况下,增加复制分片,是通过空间换时间;

猜你喜欢

转载自blog.csdn.net/zhtzh312/article/details/88862936