ElasticSearch 如何搜索

ES不仅仅存储文档,还索引内容以便可搜索。
 
每个域都被索引,可以查询,不光这些,
在一个查询里,es可以使用所有的索引,以惊人的速度返回结果。
 
一个搜索可以:
1 )搜索具体字段,比如性别或者年龄,按照加入日期排序,跟sql一样。
2 )一个全文搜索,可以找到所有的匹配文档,按照相关性返回。
3 )两者结合。
你需要了解三个主题:
1 )Mapping   数据的每个域如何解释
2 )Analysis  全文是如何处理以便搜索
3 )Query SDL 弹性的,强大的查询语言
 
 
 
1 最基本的搜索形式是空搜索,没有任何限制,仅仅是简单返回集群里的所有索引的所有文档。
 
GET /_search
响应的格式如下:
{
    "hits" : {
       "total" :       14 ,
       "hits" : [
         {
           "_index" :   "us" ,
           "_type" :    "tweet" ,
           "_id" :      "7" ,
           "_score" :   1 ,
           "_source" : {
              "date" :    "2014-09-17" ,
              "name" :    "John Smith" ,
              "tweet" :   "The Query DSL is really powerful and flexible" ,
              "user_id" : 2
           }
        },
         ... 9 RESULTS REMOVED ...
       ],
       "max_score" :   1
    },
    "took" :           4 ,
    "_shards" : {
       "failed" :      0 ,
       "successful" 10 ,
       "total" :       10
    },
    "timed_out" :      false
}
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
hits
最重要的就是hits,包含符合条件的文档总数。包含前 10 个,也就是只返回前面 10 个。
 
每个结果包含_index,_type,_id.还有_source字段。
这意味着整个文档立即可用。
不像其它搜索引擎只返回文档ID,需要你再次去拿到文档。
 
 
每个文档还包含有一个_score, 这个是相关性score,
 
默认情况下,总是返回相关度更高的文档,也就是说,按照_score逆序排列。
 
在这种情况下,我们不指定任何查询条件,所以所有的文档都是相关的,
max_score是最高分数。
 
 
took
这个字段告诉我们整个搜索花费了多少毫秒。
 
shards
这个字段告诉我们,此次查询涉及的分片的总数
多少成功,多少失败,
我们在正常条件下不期望分片失败,但是它还是可能发生的,
如果我们丢失了主分片和从分片,搜索就不会成功。
 
 
在这种条件下,es会报告说分片失败了,但是仍然从剩下的分片里搜索。
 
timeout
这个字段告诉我们查询是否超时,默认,搜索不会超时,
如果超时时间很重要,你可以指定超时时间,
 
GET /_search?timeout= 10 ms
这样es就会返回给 在超时时间之内搜到的文档。
http://my.oschina.net/qiangzigege/blog/264560
 
 
 
 
 
 
 
 
 
你是否意识到空搜索的结果包含不同的types,比如user,tweet,来自于两个不同的索引。
 
由于没有限制搜索特定的索引或者类型,我们搜索了集群里的所有文档,
 
ES并发的将搜索请求转发给每个分片的主分片或者是从分片,搜集结果,返回前10给客户。
 
 
通常,你将想在一个或者多个索引里搜索,或者一个或多个types里搜索,
我们可以在URL里指定这个。
 
/_search
搜索所有索引的所有类型
 
 
/gb/_search
搜索特定索引的所有类型
 
/gb,us/_search
搜索2个索引的所有类型
 
/g*,u*/_search
不用解释了吧
 
/gb/user/_search
搜索特定索引,特定类型的所有文档。
 
/gb,us/user,tweet/_search
不用解释了吧
 
/_all/user,tweet/_search
搜索所有索引的两个类型的所有文档。
 
当你在单个索引里搜索文档,es将搜索请求转发给索引里的每个分片的主分片或者从分片,
从每个分片里搜集结果,从多个索引里搜索是一样的。
 
理解下:一个索引,有5个主分片,在它里面搜索
完全等同于搜索5个索引,每个索引只有一个主分片。
这都不是事儿!http://my.oschina.net/qiangzigege/blog/264572
 
 
 
 
 
有14个文档,然后我们只返回了10个,剩下的怎么办?
sql使用limit关键字来指定页,es也是如此。
 
size
返回多少结果,默认10.
 
from
偏移量,默认0.
 
如果你想每页显示5个,如下:
GET /_search? size =5
GET /_search? size =5& from =5
GET /_search? size =5& from =10
 
注意到,搜索结果在返回前会被先存储起来,
记住,一个搜索通常涉及到多个分片,每个分片有自己的搜索排序结果,
然后集中起来再进行总的排序。
http://my.oschina.net/qiangzigege/blog/264584
 
 
 
 
 
 
 
 
 
 

猜你喜欢

转载自aoyouzi.iteye.com/blog/2151502