Das Konzept Elasticsearch (bezeichnet als ES) von

Ein Wissen Elasticsearch

1.1.ElasticSearch

  • ES, dass, um den Mangel an einheimischen Lucene Gebrauch zu lösen, Lucene Anrufmodus zu optimieren und ein Suchprogramm verteilte Hochverfügbarkeitscluster ausführen, dessen erste Version auf GitHub im Februar 2010 erschienen und wurde schnell zur beliebtesten einer des Projekts.
  • Java ES auch als Kern zu entwickeln und zu verwenden Lucene verwendet werden, um alle Index zu erreichen und Suchfunktion, aber ihr Zweck ist es, die Komplexität der Lucene durch eine einfache RESTful API zu verstecken, so dass Volltext einfacher suchen.
  • Elasticsearch vereinfacht die Verwendung von Volltextsuche lucene, während die verteilte Natur zu erhöhen, macht es den Bau von großer verteilten Volltextsuche ganz einfach.

1.2. Was ist ES?

  • ES lucene das Problem lösen, um den Anruf von Schwierigkeiten, ES unterstützt verteilte und gruppierten
  • ES Implementierung von verteilten Dateispeicher
  • ES Implementierung von verteilten Suche
  • Üblicherweise beträgt die Menge der Datenverarbeitung Pegeldaten PB
  • Durch einfaches Aufrufen einfach erholsame Art zu erhalten
  • Leicht zu beginnen, öffnen Sie eine Flasche des Getränks die Wirkung der erreichen kann

ES gibt es keinen Wettbewerb?

Solr er ist ein Konkurrent der Differenz zwischen ES:

  • solr tun kann, Volltextsuche, aber er ist ein schwerer Rahmen, nicht nur die Volltextsuche tun, können Sie auch eine Menge anderer Dinge tun
  • solr in Echtzeit-Suche kann nicht es passen
  • solr können sowohl verteilt und es unterstützen
  • solr unterstützen kann nosql

Die Differenz 1.3.ES und lucene

Lucene:

  • Nur unterstützt Java
  • Nicht ausgeschüttete, den Index nur im lokalen Verzeichnis
  • Verwenden Sie sehr komplex
  • Verwenden Sie kleine Projekte

1.4.ES verwandte Konzepte

1.4.1.Near Echtzeit (NRT)

In nahezu in Echtzeit, was bedeutet, zwei, werden die Daten aus den Schreibdaten können eine kleine Verzögerung (ca. 1 Sekunde) haben gesucht; es basierte Suche und Analyse in wenigen Sekunden erreicht werden

1.4.2.Index: Index-Bibliothek

Es gibt eine Reihe von Dokumenten, die ähnliche Datenstruktur wie ein Kunde einen Index haben, Warenklassifikationsindex, Index der Auftragseingänge hat der Index einen Namen. Index enthält eine Menge von Dokumenten, ein Index, eine Klasse von ähnlichen oder identischen Dokument darzustellen. Um zum Beispiel ein Produkt Index, Rohstoff-Index zu erstellen, die alle Produktdaten speichern können, die alle Waren Dokument.

1.4.3.Type: Typ

Wo jeder Index eine oder mehr Typen haben kann, ist der Typ einen Klassifizierungsindex der logischen Daten, Dokument unter einem Typ, hat das gleiche Feld wie Blog-System, einen Index, ein Benutzer kann einen Datentyp definieren, Blog Datentyp, Typ Kommentardaten.

1.4.4.Document & Bereich

Dokumente, ES kleinste Einheit von Daten in einem Dokument kann ein Kundendaten sein, eine Ware Klassifizierungsdaten, eine Auftragsdaten, in der Regel in JSON-Datenstruktur, geben Sie in jedem Index ausgedrückt, kann das gehen mehrere Dokument zu speichern. Ein Dokument, das eine Vielzahl von Feld hat, wird jedes Feld ein Datenfeld.

1.4.5.Cluster: Cluster

Enthält eine Vielzahl von Knoten, wobei jeder Knoten, dem Cluster gehört durch eine Konfiguration bestimmt wird (Clusternamen, der Standardwert ist Elasticsearch), für kleine und mittelgroße Anwendungen, der Beginn einer Cluster-Knoten auf einem normalen

1.4.6.Node: Knoten

Ein Knoten im Cluster, der Knoten hat auch einen Namen (der Standard wird zufällig zugewiesen), Knotenname ist sehr wichtig (bei der Umsetzung der Betrieb und die Wartung Management-Operationen), „Elasticsearch“ Cluster Standardknoten einen Namen zu verbinden, wenn der Direktstart ein Bündel von Knoten, dann werden sie automatisch einen Cluster Elasticsearch, natürlich bilden, kann ein Knoten ein Cluster bilden Elasticsearch

1.4.7.shard (Fragment)

Eine einzelne Maschine große Mengen von Daten nicht speichern kann, es können Daten über mehrere Speicherserver Schnitt in eine Mehrzahl von Indexscherbe, verteilt sein. Mit Scherbe skalieren kann mehr Daten zu speichern, so dass Operationen wie Suche und Analyse auf mehrere Server verteilt auszuführen, um den Durchsatz und die Leistung zu verbessern. Jede Scherbe ist ein Lucene Index.

1.4.8.replica (Replika)

Vorbehaltlich einen Serverausfall oder Ausfallzeiten, dann Scherbe kann verloren gehen, so dass Sie mehrere Kopien von jeder Replikat-Shard erstellen können. Replik kann Backup-Service zur Verfügung stellen, wenn Scherbe Ausfall, Daten zu gewährleisten ist nicht eine Vielzahl von Replik verloren, weiter den Durchsatz und die Leistung der Suchoperation verbessern kann. primäre Scherbe (Indexieren einen Satzes, kann nicht geändert werden, default 5) replica Scherbe (die Anzahl der Rückstellung einer modifizieren), wobei jede Index 10 Scherbe Voreinstellung Primärsplitter 5, 5 replica Scherbe, das kleinste Hoch verfügbare Konfigurationen, ein Server 2.

Veröffentlicht 33 Originalarbeiten · erntete Lob 0 · Aufrufe 405

Ich denke du magst

Origin blog.csdn.net/weixin_45737653/article/details/104824442
Empfohlen
Rangfolge