Elastic Enterprise Search 8.7: 新しいコネクタ、クローラー抽出ルール、検索分析クライアント ベータ版

作地:Casey Zumwalt , Aditya Tripathi

Elastic Enterprise Search 8.7 には、コンテンツの取り込みと検索エクスペリエンスを改善するために設計された機能が含まれています。このリリースでは、MySQL コネクタに高度なフィルタリング機能が追加され、MySQL データベースから大量のデータをより効率的にフィルタリングおよび抽出できるようになりました。Elastic Web Crawler は、カスタマイズ可能なコンテンツ抽出でアップグレードされ、Web ページから特定の情報を抽出してインデックス付けできるようになり、検索結果が改善され、検索エクスペリエンスが向上しました。また、コネクタのリストを大幅に拡大し、Postgres、Oracle、MS SQL などの一般的なデータベースや、GCP や Azure のクラウド BLOB ストレージ形式を含めました。

Elastic Enterprise Search 8.7 がElastic Cloud で利用できるようになりました。これは、最新バージョンのすべての新機能を含む唯一のマネージド Elasticsearch 製品です。また、Elastic Stackと当社のクラウド オーケストレーション製品、Elastic Cloud Enterprise および Elastic Cloud for Kubernetes をダウンロードして、セルフマネージド エクスペリエンスを実現することもできます。

Elastic 8.7 のその他の新機能は? 詳細については、8.7 の発表記事をご覧ください >>

コネクタ フレームワークがテスト段階に入る

Elastic Enterprise Search コネクタ フレームワークは、テクノロジー プレビューとして 8.4で最初に導入されました。Elastic Enterprise Search コネクタ フレームワークが8.7 でベータ版になったことをお知らせします。コネクタ フレームワークを使用すると、Python などの一般的な言語を使用して、カスタム データ ソース用のコネクタ クライアントを設計およびカスタマイズできます。このフレームワークに基づくコネクタのライブラリは、このリリースで大幅に拡張され、Postgres、Oracle、MS SQL などの一般的なデータベースと、GCP および Azure で一般的なクラウド BLOB ストレージ形式をサポートするようになりました。

MySQL コネクタの同期規則

この新しい機能により、データ取り込みプロセスをきめ細かく制御できるため、特定のニーズに合わせて検索結果を調整できます。同期ルールによるカスタム フィルタリングの導入により、MySQL コネクタは特定の基準に基づいてデータを含めたり除外したりできるようになりました。ワークフローでクエリを使用して高度なフィルタリングを行うことができるため、インデックスを作成する前に複雑なリモート データ変換を実行できます。これにより、ドキュメントがソースでフィルタリングされ、MySQL データをフェッチする方法がより柔軟になるため、ネットワーク転送サイズが大幅に削減される可能性があります。

Elastic Web Crawler のコンテンツ取得とスケジューリングの改善

Elastic Enterprise Search 8.7 は、Elastic Web Crawler にいくつかの優れた改善をもたらします。コンテンツ抽出ルールの導入により、HTML または CSS タグ、正規表現パターン、URL などを使用して Web ページからコンテンツをより正確に抽出できます。特定の URL の完全な HTML 出力の抽出と保存をサポートし、Web コンテンツを取得する際の柔軟性を高めます。さらに、このリリースでは、カスタム クロールのプログラムによるスケジュールのサポートが導入され、ニーズにより適したさまざまな構成で複数のスケジュールを登録できるようになりました。

コンテンツ抽出ルールの導入

コンテンツ抽出ルールを使用すると、HTML 要素、CSS クラス、正規表現パターン、URL などから Web ページ コンテンツをフィルタリングして抽出できるようになり、最も重要なコンテンツを簡単に抽出できるようになりました。この機能は、基になる HTML ソースに完全にアクセスできないサードパーティのツールまたはアプリケーションから Web コンテンツを抽出する必要がある場合に特に便利です。基礎となる Web コンテンツの複雑さに関係なく、必要なデータを簡単に抽出します。

完全な HTML 抽出をサポート

Elastic Enterprise Search 8.7 では、Elastic Web Crawler を使用して特定の URL の完全な HTML 出力をフェッチするためのサポートも導入されています。この新機能により、URL の完全な HTML 出力をフィールドに保存できます。この機能を Elastic の取り込みパイプラインと組み合わせると、カスタム コンテンツの取り込みにほぼ無限の可能性がもたらされます。Elastic の取り込みパイプラインを使用してコンテンツをさらに処理することで、Web ページから任意のデータや情報を抽出できるため、Web コンテンツの柔軟性と制御が向上します。

カスタム クロールのプログラムによるスケジューリング

このリリースのもう 1 つの新機能は、Elastic Web Crawler がカスタム クロールのプログラムによるスケジューリングをサポートするようになったことです。この機能により、構成が異なる複数のプランを登録できるため、クローラーの「デフォルト」のプラン構成をオーバーライドできます。たとえば、Web サイトごとに異なる時間または間隔でクロールをスケジュールしたり、コンテンツが頻繁に変更されるページのクロールをより頻繁にスケジュールしたりできます。

Web および検索分析クライアント ベータ版の紹介

8.7 の新機能である Web and Search Analytics Client を使用すると、Elastic を使用して、Web サイト、アプリケーション、および検索分析でユーザーの行動をキャプチャ、分析、視覚化して、検索の関連性の最適化と Web サイトの改善を通知できます。

それを試してみてください

これらの機能の詳細については、リリース ノートを参照してください

Elastic Cloud の既存のお客様は、これらの機能の多くにElastic Cloud コンソールから直接アクセスできます。Elastic on Cloud を利用していませんか? 無料トライアルを開始します

このブログ投稿に記載されている機能のリリースとタイミングは、Elastic の独自の裁量によるものです。現在利用できない機能は、予定どおりに提供されないか、まったく提供されない可能性があります。

オリジナル: https://www.elastic.co/blog/whats-new-elastic-enterprise-search-8-7-0

おすすめ

転載: blog.csdn.net/UbuntuTouch/article/details/130074850