Elasticsearch、Solrの、Luceneと、エルメス区别

Elasticsearchプロフィール

Elasticsearchは、分散型リアルタイム検索および分析エンジンです。それはあなたが可能前に速く、これまで以上に大規模なデータを処理することができます。
これは、フルテキスト検索、構造検索、分析に使用されており、これら三つの混合:
ウィキペディア使用Elasticsearchは、フルテキスト検索とハイライトのキーワードを提供し、リアルタイムの検索を入力してください(検索-asyou型)および誤り訂正を検索(did-あなたの平均)と、他の検索候補。
ガーディアン使用Elasticsearchの新しく発行された記事への公共応答に遅れないようにするために、リアルタイムのフィードバックとその編集者へのソーシャルネットワーキングとユーザーログデータの組み合わせ、。
StackOverflowのは、フルテキスト検索クエリと場所だけでなく、組み合わせて、より様、この関連の質問と回答を検索する機能を。
Githubのは、使用Elasticsearchを取得1300本のコード万人のラインを。
しかしElasticsearch だけでなく、大企業のために、それが許す限りDataDog Klout 、そのようなベンチャー企業スケーラブルなソリューションへの当初のアイデアでしょう。Elasticsearchはあなたのラップトップ上で実行することができ、それはまた、上のサーバーの数百人を扱うことができるPBレベルのデータ。

Elasticsearchが基づいているのApache Luceneの(TM) オープンソースの検索エンジン。かどうかは、オープンソースまたは独自の分野では、Luceneには、これまでで最も先進的な、最高のパフォーマンス、最も汎用性の高い検索エンジンライブラリであると考えることができます。
しかし、Luceneのはただのライブラリです。それを使用したい、あなたが使用しなければならないのJavaを開発言語として、あなたのアプリケーションに直接統合、メイクが悪化重要、Luceneのは非常に複雑であり、あなたはそれがどのように機能するかを理解するために、関連する知識検索を理解する必要があります。
Elasticsearchはまた、使用するJavaを開発し、使用のLuceneをすべてのインデックスを達成し、機能を検索するための中核として、しかしその目的は単純で  RESTfulなAPI  非表示にするのLucene のフルテキストを簡単に検索するように、複雑。

Solrの紹介

SolrにはLuceneのフルテキスト検索サーバーに基づいてJavaで開発されたトップレベルのApache、下のオープンソースプロジェクトです。Solrの検索性能が最適化され、設定可能な、拡張性の高い、とインデックスを達成しながら、Luceneクエリ言語よりもリッチを提供します

Solrには突堤で実行されている、独立して実行することができ、実装Solrのインデックスは、POSTメソッドで、非常にシンプルであるこれらのようなTomcatのサーブレットコンテナは、XML文書のSolr追加、削除、更新に応じて、フィールドのSolrサーバにその内容を記述したXMLドキュメントを送信しますインデックス。Solrの検索のみHTTP GETリクエストを送信する必要があり、その後、リターンのクエリは、XML、SolrのパースのJSON形式は、ページレイアウトを整理結果。SolrにはUIを構築するための機能を提供していない、Solrには、Solrのの構成と動作を確認することができ、管理インタフェースを介して、管理インターフェイスを提供します。

SolrのLuceneの開発は、エンタープライズ・サーチ・サーバーに基づいており、実際のLuceneをカプセル化しています。

Solrには、WebサービスAPIインタフェースに似た外部提供スタンドアロンのエンタープライズ・サーチのアプリケーション・サーバー、です。ユーザーがインデックスを生成するために、検索エンジンサーバファイルへのHTTPリクエストによって、特定のフォーマットを提出することができます。あなたはまたによって行われた要求を見つけ、その結果を取り戻すことができます。

Luceneの紹介

Luceneには、サブプロジェクト4ジャカルタApache Software Foundationのプロジェクトチームであるオープンソースの全文検索エンジンのツールキットですが、それは完全なフルテキスト検索エンジンが、フルテキスト検索エンジンアーキテクチャではない、完全なを提供しますクエリエンジンとインデックスエンジン、テキスト分析エンジン(英語とドイツ語西洋言語の2種類)の一部。Luceneのは、対象システムで、または完全なフルテキスト検索エンジンを確立するための基礎として、フルテキスト検索機能の実現を容易にするための使いやすいツールキットとソフトウェア開発者を提供するように設計されています。Luceneには、Apache Software Foundationが提供するフルテキスト検索と検索、およびサポートのためのオープンソースライブラリです。Luceneには、フルテキストインデックス作成と検索を行うことができる、シンプルで強力なアプリケーション・プログラム・インターフェースを提供します。LuceneのJava開発環境は、本格的な無料のオープンソースツールです。その一部については、Luceneには、現在、近年のほか、無料のJava情報検索ライブラリーの中で最も人気があります。検索エンジンに関連するが、それは多くの場合、情報検索ライブラリーと呼ばれますが、検索エンジンで情報検索ライブラリが混同してはなりません。

Luceneには、フルテキスト検索エンジンのアーキテクチャです。全文検索エンジンとは何ですか?

全文検索エンジンは、真の検索エンジンで、外国人の代表には、Google、高速/ AllTheWeb、アルタビスタ、Inktomiの、Teoma、WiseNutや他の有名な持ち百度(Baiduのを)持っています。彼らはそこで彼らは、その後、インターネット上のさまざまなウェブサイトから情報を抽出することにより、データベース(Webページのテキストベースの)条件に一致するレコードを取得するために、ユーザーのクエリを確立し、その結果を利用者に返却されている特定の順序ですそれは真の検索エンジンです。

検索結果のソースの観点から、フルテキスト検索エンジンを2つに分けることができ、一つは一般に「スパイダー」(スパイダー)のプログラムや「ロボット」(ロボット)プログラム、および自己として知られている、独自の検索プログラム(インデクサー)でありますウェブデータベースは、検索結果には、前述したように7つのエンジン、独自のデータベースから直接呼び出します。他には、ライコスなどのランキング検索エンジンのカスタム書式に従って、他のデータベースエンジンにリースされています。

Elasticsearchと比較してSolr

Solrの概要対ElasticSearch

  (1)は、箱から出して、それは非常に単純である、実質的にES。SolrのインストールDiudiu少し複雑、心配することができる(solr6.6チュートリアル-ビルドにBasic環境()

  (2)のSolrは、飼育係を使用して、管理を分散し、それ自身の機能を備えた分散協調Elasticsearchの管理。

  (3)のSolrは、JSONなどの複数のデータフォーマットをサポートし、XML、CSV、およびElasticsearchのみJSONファイル形式をサポートしています。

  (4)は、より正式な機能のSolrを提供し、Elasticsearch自体は、コア機能、このようなkibanaフレンドリーなグラフィカルインタフェースがサポートを必要とするなどのサードパーティのプラグインよりも提供する高度な機能に集中します

  (5)高速でSolrのクエリが、インデックス(すなわち、挿入や削除が遅い)、および電気の供給業者やその他のお問い合わせのためのより多くのアプリケーションを更新するときに遅いです

      ESは、高速のFacebookシーナの検索のために、(つまり、スロークエリ)速い、すなわちリアルタイムクエリをインデックス化。

       Solrには、従来の検索アプリケーションのための強力なソリューションですが、リアルタイム検索アプリケーションを新興のためのElasticsearchより適切な。

  (6)Solr比较成熟,有一个更大,更成熟的用户、开发和贡献者社区,而 Elasticsearch相对开发维护者较少,更新太快,学习使用成本较高。

 

Hermes

在整理solr和es资料的时候意外发现了一篇文章 Hermes与开源的Solr、ElasticSearch的不同,中提到了hermes和他们两者的对比,于是摘抄了下面的部分文字,由于首次见到没有什么了解,今摘抄下了给广大读者有兴趣的朋友吧1

Solr\ES :偏重于为小规模的数据提供全文检索服务;Hermes:则更倾向于为大规模的数据仓库提供索引支持,为大规模数据仓库提供即席分析的解决方案,并降低数据仓库的成本,Hermes数据量更“大”。

Solr、ES的使用特点如下:

1. 源自搜索引擎,侧重搜索与全文检索。 
2. 数据规模从几百万到千万不等,数据量过亿的集群特别少。

Hermes:的使用特点如下:

1. 一个基于大索引技术的海量数据实时检索分析平台。侧重数据分析。 
2. 数据规模从几亿到万亿不等。最小的表也是千万级别。在腾讯17 台TS5机器,就可以处理每天450亿的数据(每条数据1kb左右),数据可以保存一个月之久。

 转:https://www.cnblogs.com/blueskyli/p/8326229.html

おすすめ

転載: www.cnblogs.com/651434092qq/p/12102461.html