ナレッジ マップで何ができるかを理解するための記事です。この記事には、Jiagu 自然言語処理ツールの試用とナレッジ マップの実戦が含まれています。

ナレッジグラフの概要:

ナレッジ グラフは、ビッグ データ時代の重要なインフラストラクチャ基盤として、次世代検索エンジン、インテリジェントな質問応答システム、テキスト処理、自然言語処理などのインテリジェント アプリケーションで広く使用されています。ナレッジ グラフは知識のストレージを標準的に定義し、知識の推論と意思決定をより便利かつ効率的に行うことができます。特定の領域に対するナレッジ グラフの応用に関する研究も増えています。現在、ロボット工学に基づくナレッジグラフアプリケーションの人気は高まり続けていますが、それをサポートするインテリジェントな質問応答システムの関連技術はまだ未熟です。

 1. 一部の分野でのナレッジマップの適用

1.1 ナレッジグラフの概要

ナレッジ グラフは新しい概念ではありません。2006 年には文献 [5] でセマンティック Web の概念が提案され、データ内の暗黙的なセマンティクスを形式的に表現するためのオントロジー モデル、RDF (リソース記述フレームワーク) の推進と改善が求められていました。 RDF スキーマと Web オントロジー言語 (OWL) の形式モデルは、上記の目的に基づいています。その後、セマンティックウェブの研究が盛り上がり、ナレッジグラフ技術の登場は、上記の関連研究をベースにして、セマンティックウェブの標準や技術を昇華・昇華させたものです。ナレッジ マップは、2012 年 5 月 17 日に Google によって正式に提案されました [6]。その当初の目的は、検索エンジンの機能を向上させ、ユーザーの検索品質と検索エクスペリエンスを向上させることでした。現在、インテリジェント情報サービスアプリケーションの継続的な開発に伴い、ナレッジグラフはインテリジェント検索、インテリジェントな質疑応答、パーソナライズされた推奨などの分野で広く使用されています。特にインテリジェント検索では、ユーザーの検索リクエストは単純なキーワードの一致に限定されなくなり、ユーザーのクエリのコンテキストと意図に基づいて検索が推測され、概念の検索が実現されます。同時に、ユーザーの検索結果には階層や構造などの重要な特徴が含まれます。たとえば、ユーザーが検索したキーワードがゴッホの場合、エンジンはゴッホの詳細な生涯、芸術的経歴情報、さまざまな時代の代表的な作品を写真などの説明情報とともにナレッジカードの形式で提供します。ナレッジ グラフにより、コンピュータは人間の言語コミュニケーション パターンを理解できるようになり、ユーザーが必要とする答えをよりインテリジェントにフィードバックできるようになります [7]。同時に、ナレッジ グラフは、Web 上の情報、データ、リンク関係をナレッジに集約し、情報リソースの計算、理解、評価を容易にし、一連の Web セマンティック ナレッジ ベースを形成できます。

1.2 ナレッジグラフの特徴

ナレッジマップには以下の 3 つの特徴があります。 ① データと知識の格納構造は有向グラフ構造です。有向グラフ構造により、ナレッジ マップはデータと知識の間の関係を効果的に保存できます; ② 効率的なデータと知識の検索機能を備えています。ナレッジ グラフは、グラフ マッチング アルゴリズムを通じて効率的なデータと知識へのアクセスを実現できます; ③ インテリジェントなデータと知識推論機能を備えています。ナレッジ グラフは、既存の知識から複数の角度から暗黙的な知識を自動的かつインテリジェントに発見し、推論することができます。

1.3 ナレッジグラフの利点と価値

(1) 関係性の表現力が高い

従来のデータベースは、テーブルやフィールドなどを介して読み取られることが多く、関係のレベルや表現は様々ですが、グラフ理論や確率グラフモデルに基づいて、複雑かつ多様な関連分析に対応でき、さまざまな役割関係の分析や解析に対応します。企業における管理ニーズ。

(2) 人間の思考のように分析を行う

ナレッジマップに基づくインタラクティブな探索的分析は、人間の発見、検証、推論の思考プロセスをシミュレートすることができ、ビジネス担当者は専門家の支援なしでプロセス全体を自分で完了できます。

(3) 知識学習

インタラクティブな機械学習テクノロジーを使用して、推論、エラー修正、ラベル付けなどのインタラクティブなアクションに基づく学習機能をサポートし、ナレッジ ロジックとモデルを継続的に蓄積し、システム インテリジェンスを向上させ、企業内にナレッジを蓄積し、経験への依存を軽減します。

(4) 高速フィードバック

従来の保存方法と比較して、スキーマ データ保存方法はデータ取得速度が速く、ギャラリーは 100 万を超える潜在的なエンティティの属性分布を計算し、数秒で結果を返すことができ、人間のリアルタイムの応答を真に実現します。 - ユーザーが即座に決定できるようにするためのコンピューターとの対話。

1.4 ロボティクス分野におけるナレッジマップの応用

ナレッジ グラフの最も初期の応用は、検索エンジンの能力を向上させることです。その後、ナレッジ グラフは、補助的なインテリジェントな質問応答、自然言語理解、ビッグ データ分析、レコメンデーション コンピューティング、モノのインターネット デバイスの相互接続、解釈可能なロボットなど、多くの側面で豊富な応用価値を示しています。

1.4.1支援ロボット組み込み検索

インターネットの究極の形はあらゆるものの相互接続であり、検索の最終目標はあらゆるものの直接検索です。従来の検索エンジンは Web ページ間のハイパーリンクに依存して Web ページを検索しますが、セマンティック検索は人、機関、場所などの物を直接検索します。これらは、テキスト、画像、ビデオ、オーディオ、IoT デバイスなどのさまざまな情報リソースから取得される可能性があります。ナレッジ グラフとセマンティック テクノロジは、これらのものの分類、属性、関係に関する説明を提供するため、図 1-1 に示すように、検索エンジンが直接インデックスを作成して検索できるようになります。

                                             図 1-1 ナレッジマップを利用した検索

1.4.2支援ロボットに関するQ&A

自然言語を介した人間とロボット間の質問応答と対話は、人工知能実現の重要な兆候の 1 つです。ナレッジ グラフは、検索支援に加えて、人間とコンピューターの質問と回答の対話にも広く使用されています。業界では、IBM Watson は、DBpedia や Yago などの百科事典的な知識ベースや WordNet などの言語知識ベースに依存して、詳細な知識に関する質問への回答を実現しています。Amazon Alex は主に True Knowledge によって蓄積されたナレッジ グラフに依存しています。Dumi、Siri の進化版 Viv、Xiaoai Robot、Tmall Genie の背後には、膨大な知識グラフがあります。

ロボットやIoTデバイスのインテリジェント化の波に伴い、インテリジェント運転、スマートホーム、スマートキッチンなどの分野でナレッジグラフに基づく質疑応答の応用が後を絶たない形で登場しています。ナレッジ グラフに基づく一般的な質問応答技術または方法には、セマンティック解析に基づく、グラフ マッチングに基づく、テンプレート学習に基づく、表現学習と深層学習に基づく、およびハイブリッド モデルに基づくものがあります。これらの方法では、ナレッジ グラフはセマンティック分析を支援するだけでなく、質問エンティティの照合、ニューラル ネットワークとランキング モデルのトレーニングにも使用されます。ナレッジグラフは、人間とコンピュータのインタラクションによる質問応答を実現するために不可欠なモジュールです。

1.4.3ロボットデータ解析支援

ナレッジ グラフとセマンティック テクノロジも、データ分析と意思決定を支援するために使用されます。たとえば、ビッグ データ企業である Palantir は、オントロジーに基づいて複数のソースからのデータを融合および統合し、ナレッジ グラフとセマンティック テクノロジを通じてデータ間の関係を強化することで、ユーザーがより直感的なグラフを使用してデータのマイニングと分析を行うことができます。

ナレッジ グラフは、テキスト データの処理と分析においても独自の役割を果たします。たとえば、ナレッジ グラフは、遠隔監視におけるアプリケーションなど、テキストからエンティティや関係を抽出するための事前知識として広く使用されています。ナレッジ グラフは、エンティティの曖昧さの解消 (Entity Disambiguation)、参照の解決、テキスト内のテキストの理解を支援するためにも使用されます。

近年、記述的データ分析(Declarative Data Analysis)がますます注目を集めています。記述データ分析とは、データ自体の意味記述に基づいてデータ分析を実現する手法を指します。さまざまな計算データ分析は、主にディープ ニューラル ネットワークなどのさまざまなデータ分析モデルを確立することを目的としていますが、記述的データ分析は、事前に抽出されたデータのセマンティクスを強調表示し、データ間のロジックを確立し、論理推論手法 (DataLog など) に依存して、データ分析を実現します。

1.4.4ロボットの言語理解支援

背景知識、特に常識的な知識は、深い意味理解 (読解、人間とコンピューターの質問応答など) に不可欠な構成要素であると考えられています。代表的な例は、Winograd Schema Challenge (WSC コンペティション) です。WSC は、有名な人工知能の専門家ヘクター・レベスク教授によって提唱され、2016 年に人工知能国際会議 IJCAI で第 1 回 WSC 大会が開催されました。WSC は主に、文の意味論を理解するために背景知識を重ね合わせる必要がある NLP タスクに焦点を当てています。例えば以下の例では、bigと表記されていればトロフィーのことであることが分かりやすく、smallと表記されていればスーツケースのことであることが分かりやすいです。

トロフィーは大きすぎる(小さい)ので、茶色のスーツケースに入りません。大きすぎる(小さい)のは何ですか?

答え 0: トロフィー 答え 1: スーツケース

この一見非常に簡単な問題は、機械では解決できません。自然言語理解の先駆者であるテリー・ウィノグラード氏が述べたように、人は文を聞いたり、文を見たりするとき、それを理解するために自分の知識と知性のすべてを総動員します。これには、文法だけでなく、語彙の知識、文脈の知識、そしてさらに重要なことに、関連する事柄の理解も含まれます。

1.4.5ロボット補助装置の相互接続

人間とコンピューターの対話の主な課題は、意味の理解、つまり機械に人間の言語の意味を理解させることです。もう 1 つの問題はマシン間の対話であり、これにはマシン言語のセマンティクスを表現および処理するための技術的手段も必要です。セマンティック テクノロジーは、デバイス間のセマンティック相互接続を容易にするために使用することもできます。OneM2M は、2012 年に設立された世界最大のモノのインターネットの国際標準化団体です。主に IoT デバイス間の相互接続のための「標準化された接着剤」を提供しています。OneM2Mは、デバイスデータをカプセル化する際のセマンティック技術のセマンティクスに着目し、セマンティック技術に基づいてデバイス間のセマンティック相互運用性を実現します。さらに、OneM2M は、デバイス データのセマンティクスと人間の言語のセマンティクスがどのように適応するかにも注目しています。図 1-2 に示すように、デバイスによって生成された元のデータがセマンティック記述をカプセル化した後、他のデバイスのデータとより簡単に融合、交換、および相互運用することができ、検索をサポートするためにナレッジ マップにさらにリンクすることができます。 、推論と分析のタスク。

                                                         図 1-2 デバイス セマンティクスのカプセル化

2. OpenKGオープンソースツールのトライアル

2.1 Jiagu 自然言語処理ツールの概要

Jiagu は BiLSTM などのモデルに基づいており、大規模なコーパスを使用してトレーニングされています。中国語の単語分割、品詞タグ付け、固有表現認識、センチメント分析、ナレッジグラフ関係抽出、キーワード抽出、テキスト要約、新語発見などの一般的な自然言語処理機能を提供します。主要なツールのメリット・デメリットを参考に作成し、Jiaguを皆様にお届けします。

2.2 Jiagu 自然言語処理ツールがローカルにデプロイされている

2.2.1 Jiaguをダウンロードする

まず、OpenKG 公式 Web サイトにアクセスして、プロジェクトのオープンソース ページを見つけます。これは、Sizhi Robotics によってオープンソース化されたナレッジ グラフ ツールです。次に、Github に移動してプロジェクトをダウンロードします。

           

 

                                        図 2-1 OpenKG 公式 Web サイトのビュー Jiagu

                                       図 2-2 Github ビュー Jiagu オープンソース プロジェクト

2.2.2 Jiagu の仮想環境を作成する

環境を作成するには、まず anaconda をインストールする必要があります

まず、anaconda を開き、次のコマンドを順番に入力します。

conda create -n Jiagu python=3.8

conda は Jiagu をアクティブにします     

次に、「python3 setup.py install」と入力します。

          

                                            図 2-3 anaconda による仮想環境の作成

           

図 2-4 JiaguNLP ツールのインストール

                                         図 2-5 正常にインストールされた Jiagu

次にnumpyをインストールします   

 

                                                           図 2-6 numpy のインストール

次に、matplotlibを再度インストールする必要があります

                                             図 2-7 matplotlib のインストール

このようにして、必要な 3 つのパッケージ (jiagu、matplotlib、および numpy) がインストールされます。

2.3 Jiagu インスタンスの実行と使用

2.3.1 単語分割、品詞タグ付け、固有表現認識

次のように Python コードを実行します。

輸入嘉谷

#jiagu.init() # 手動または動的に初期化可能

text = 'アモイでは明日雨が降りますか'

Words = jiagu.seg(text) # 単語の分割

印刷(単語)

pos = jiagu.pos(words) # 品詞タグ付け

印刷(pos)

ner = jiagu.ner(words) # 固有表現認識

プリント(ナー)

         

                                図 2-8 単語の分割、品詞のタグ付け、および固有表現の認識

2.3.2 デモテスト

次に、テストのためにデモを実行します

テストコードは次のとおりです。

輸入嘉谷

# jiagu.init() # 手動または動的に初期化可能

text = '蘇州の天気は良いです'

Words = jiagu.seg(text) # 単語の分割

印刷(単語)

Words = jiagu.cut(text) # 単語の分割

印刷(単語)

pos = jiagu.pos(words) # 品詞タグ付け

印刷(pos)

ner = jiagu.ner(words) # 固有表現認識

プリント(ナー)

# 辞書モードの単語分割

text = 'Sizhi Robot はとても使いやすいです'

単語 = jiagu.seg(テキスト)

印刷(単語)

# jiagu.load_userdict('dict/user.dict') # カスタム辞書をロードし、辞書パス、辞書リスト形式をサポートします。

jiagu.load_userdict(['Sizhi Robot'])

単語 = jiagu.seg(テキスト)

印刷(単語)

テキスト = ''

研究の共著者の一人でボストン大学地球環境科学部の博士号を取得したチェン・チー氏は、「中国とインドは世界の陸地面積の9%に過ぎないが、それらは世界の陸地面積の9%以上に貢献している」と述べた。 1. 人口過密国における土地の過剰利用という一般的な問題を考えると、この発見は驚くべきことである。」

NASAエイムズ研究センターの科学者ラマ・ネマニ氏は、「この長期データにより、地表の緑化の背後にある要因を分析することができます。私たちは当初、植生の増加は二酸化炭素の排出量の増加によるものだと考えていました。その結果、成長に適した、より暖かく湿度の高い気候です。」

「MODIS データのおかげで、この現象を非常に小さなスケールで理解することができ、人間の活動も寄与していることがわかりました。」

NASAの記事によると、世界の緑化プロセスに対する中国の貢献の42%は植林プロジェクトによるもので、土壌浸食、大気汚染、気候変動の軽減に貢献してきた。

Observer.com の以前のレポートによると、2017 年に我が国は合計 736 万 2000 ヘクタールの植林と 830 万 2000 ヘクタールの森林整備を完了しました。このうち、天然林資源保護事業では26万ヘクタールの森林が造林され、農地を森林に戻す事業では91万2,000ヘクタールが造林されています。北京・天津間の砂嵐発生源対策プロジェクトで、18万5000ヘクタールの森林が植林された。三北や長江流域などの主要な防風林システムプロジェクトで、99万1,000ヘクタールの森林が植林されている。68万ヘクタールの国有保護林の建設任務を完了する。

「」

キーワード = jiagu.keywords(text, 5) # キーワード抽出

印刷(キーワード)

summary = jiagu.summarize(text, 3) # テキストの概要

印刷(要約)

# jiagu.findword('input.txt', 'output.txt') # 大規模なコーパスに基づいて、情報エントロピーを使用して新しい単語を検索します。

# ナレッジグラフ関係抽出

text = 'ヤオ・ミンは、1980年9月12日に上海市徐匯区で生まれました。彼の祖先は江蘇省蘇州市呉江区鎮澤鎮です。彼は元中国のプロバスケットボール選手であり、センターフォワードです。現在は中国職業連盟の会長兼ゼネラルマネージャー。'

知識 = jiagu.knowledge(テキスト)

印刷(知識)

#感情分析

text = '非常に意地悪または怠け者'

センチメント = jiagu.センチメント(テキスト)

プリント(センチメント)

# テキストクラスタリング (調整パラメータが必要)

ドキュメント = [

        「Baidu Deep Learning 中国語感情分析ツール Senta トライアルおよびオンライン テスト」、

        「感情分析は自然言語処理の注目のトピックです」、

        「AI Challenger 2018 テキスト マイニング コンペティション関連のソリューションとコードの概要」、

        「ディープラーニングの実践: 映画レビューテキストの感情分析をゼロから実行する」、

        「BERT 関連の論文、記事、コード リソースの概要」、

        "BERT 事前トレーニング モデルを使用してさまざまな長さの文をエンコードし、固定長ベクトルにマッピングします。",

        「自然言語処理ツールキット spaCy のご紹介」、

        「これで、spaCy の関連機能をすぐにテストできます。例として英語のデータを見てみましょう。spaCy は現在、主に英語とドイツ語をサポートしています。」

    ]

クラスター = jiagu.text_cluster(docs)

印刷(クラスター)

コードの実行結果のスクリーンショットは次のとおりです。

                                                    図 2-9 デモは正常に実行されます。
2.3.3 中国語の単語の分割

実行中のコードは次のとおりです。

輸入嘉谷

text = '漢服と衣服、ウィキマップ'

単語 = jiagu.seg(テキスト)

印刷(単語)

# jiagu.load_userdict('dict/user.dict') # カスタム辞書をロードし、辞書パス、辞書リスト形式をサポートします。

jiagu.load_userdict(['漢服と衣類'])

Words = jiagu.seg(text) # カスタム単語分割、辞書単語分割モードが有効です

印刷(単語)

                                               図 2-10 中国語単語分割の実行

2.3.4 ナレッジグラフ関係の抽出

このケースは、Wikipedia の説明を使用してのみテストできます。著者は、API が後の段階で公開され、より良い結果が得られることを提案しています。

コードは以下のように表示されます。

輸入嘉谷

# Kiss Goodbye はジャッキー・チャンが歌う曲です。

# 「トゥームレイダーノート」は、2014年にHuanrui Century Film and Television Media Co., Ltd.が制作したオンラインシーズンドラマです。Nanpai Sanshuの同名小説を原作とし、Zheng BaoruiとLuoが共同監督しています。永昌、リー・イーフェン、ヤン・ヤン、タン・ヤン、リウ・ティアンズオ、チャン・ジヤオ、ウェイウェイなどが出演。

text = 'ヤオ・ミンは、1980年9月12日に上海市徐匯区で生まれました。彼の祖先は江蘇省蘇州市呉江区鎮澤鎮です。彼は元中国のプロバスケットボール選手であり、センターフォワードです。現在は中国職業連盟の会長兼ゼネラルマネージャー。'

知識 = jiagu.knowledge(テキスト)

印刷(知識)

                                            図2-11 稼働関係の抽出

2.3.5 キーワードの抽出

コードは以下のように表示されます。

輸入嘉谷

テキスト = ''

研究の共著者の一人でボストン大学地球環境科学部の博士号を取得したチェン・チー氏は、「中国とインドは世界の陸地面積の9%に過ぎないが、それらは世界の陸地面積の9%以上に貢献している」と述べた。 1. 人口過密国における土地の過剰利用という一般的な問題を考えると、この発見は驚くべきことである。」

NASAエイムズ研究センターの科学者ラマ・ネマニ氏は、「この長期データにより、地表の緑化の背後にある要因を分析することができます。私たちは当初、植生の増加は二酸化炭素の排出量の増加によるものだと考えていました。その結果、成長に適した、より暖かく湿度の高い気候です。」

「MODIS データのおかげで、この現象を非常に小さなスケールで理解することができ、人間の活動も寄与していることがわかりました。」

NASAの記事によると、世界の緑化プロセスに対する中国の貢献の42%は植林プロジェクトによるもので、土壌浸食、大気汚染、気候変動の軽減に貢献してきた。

Observer.com の以前のレポートによると、2017 年に我が国は合計 736 万 2000 ヘクタールの植林と 830 万 2000 ヘクタールの森林整備を完了しました。このうち、天然林資源保護事業では26万ヘクタールの森林が造林され、農地を森林に戻す事業では91万2,000ヘクタールが造林されています。北京・天津間の砂嵐発生源対策プロジェクトで、18万5000ヘクタールの森林が植林された。三北や長江流域などの主要な防風林システムプロジェクトで、99万1,000ヘクタールの森林が植林されている。68万ヘクタールの国有保護林の建設任務を完了する。

「」

キーワード = jiagu.keywords(text, 5) # キーワード

印刷(キーワード)

                                                     図 2-12 キーワード抽出の実行

2.3.6 感情分析

コードは以下のように表示されます。

輸入嘉谷

text = '非常に意地悪または怠け者'

センチメント = jiagu.センチメント(テキスト)

プリント(センチメント)

                                                    図 2-13 センチメント分析の実行

2.3.7 テキストクラスタリング

コードは以下のように表示されます。

輸入嘉谷

ドキュメント = [

        「Baidu Deep Learning 中国語感情分析ツール Senta トライアルおよびオンライン テスト」、

        「感情分析は自然言語処理の注目のトピックです」、

        「AI Challenger 2018 テキスト マイニング コンペティション関連のソリューションとコードの概要」、

        「ディープラーニングの実践: 映画レビューテキストの感情分析をゼロから実行する」、

        「BERT 関連の論文、記事、コード リソースの概要」、

        "BERT 事前トレーニング モデルを使用してさまざまな長さの文をエンコードし、固定長ベクトルにマッピングします。",

        「自然言語処理ツールキット spaCy のご紹介」、

        「これで、spaCy の関連機能をすぐにテストできます。例として英語のデータを見てみましょう。spaCy は現在、主に英語とドイツ語をサポートしています。」

    ]

クラスター = jiagu.text_cluster(docs)

印刷(クラスター)

                                                   図 2-14 テキスト クラスタリングの実行


2.3.8 品詞の説明

n 普通名詞 nt 時間名詞 nd 場所名詞 nl 場所名詞

nh の名 nhf の姓 nhs の名 ns 地名 

ni 機関名 nz その他の固有名 v 動詞

vd 方向動詞 vl 接続動詞 vu 意欲動詞 a 形容詞

f 微分詞 m 数字 q 数量詞 d 副詞

r 代名詞 p 前置詞 c 接続詞 nn 姓

u 助詞 e 間投詞 o オノマトペ

i イディオム j 略語 h 接頭辞付きコンポーネント

k の後に構成要素 g が続く 形態素 x 非形態素

w 句読点 ws 漢字以外の文字列 w その他の不明な記号

2.3.9 名前付きエンティティの説明

B-PER、I-PER名

B-LOC、I-LOCの地名

B-ORG、I-ORG機関名

2.4 エラーの報告と解決

エラー 1: コード実行エラー: TypeError: Population はシーケンスまたはセットである必要があります。辞書の場合は list(d) を使用してください

エラー 1 を解決します。

変更: list() でラップするだけです。

features =random.sample(list(dataSet.columns.values[:-1]), int(math.sqrt(m - 1)))

3. OPENKGとNeo4jの対話型連携

3.1 機能設計

OpenKGは主にナレッジマップデータ(構造化データ、意味論的データ、知識ベース)のオープン性に焦点を当てており、広義のオープンデータの一種です。これは、2015 年に中国中国語情報協会の言語および知識コンピューティング専門委員会によって開始および提唱されたオープン ナレッジ グラフ コミュニティ アライアンス プロジェクトです。中国ベースのナレッジ グラフ データのオープン化、相互接続、クラウドソーシングだけでなく、ナレッジ グラフ アルゴリズム、ツール、プラットフォームのオープンソースおよびオープンワークを促進することを目的としています。

Neo4j は、構造化データをテーブルではなくネットワーク上に保存する高性能の NOSQL データベースです。これは、完全なトランザクション機能を備えた組み込みのディスクベースの Java 永続エンジンです。Neo4j は、成熟したデータベースのすべての機能を備えた高性能グラフ エンジンとみなすこともできます。openKG 中国語オープンナレッジマップにログインしてマップ csv ファイルを取得し、ファイルを neo4j にインポートして実行し、マップを視覚化して関係の接続を視覚化します。この openKG と neo4j プロジェクトでは、Neo4j ナレッジ マップ CSV を海産魚知識百科事典にインポートする方法を学びます。

3.2 CSVインポート処理

3.2.1 csvファイルのダウンロード

次に、OpenKG 公式 Web サイトにアクセスして、図 3-2 に示すように、海洋魚百科事典ナレッジ マップの CSV ファイルをダウンロードします。CSV エンコード形式は UTF-8 形式です。

      

                                      図 3-1 Web ページからの CSV ファイルのダウンロード

                                              図 3-2 ダウンロードされた CSV ファイル

3.2.2 CSVファイルのインポート

次のステップは、csv ファイルをインポートすることです。まず、neo4j のメイン ディレクトリ E:\NEO4J_HOME\bin に入ります。

次に、図 3-3 に示すように cmd にコマンドを入力し、数秒待つと、2 つの CSV ファイルが正常にインポートされます。

インポート 37449 ノード (ノード)、114863 関係 (関係)、572742 プロパティを表示します。

     

                                                     図 3-3 csv ファイルの正常なインポート

3.2.3 neo4j デフォルトデータベースを変更する

構成ファイルを変更し、conf フォルダー内の neo4j.conf 内の dbms.active_database = neo4j.db を次のように変更します。

dbms.active_database = 自分のデータベース名.db を入力し、先頭の # を削除します。

ここでは、neo4j を onepice.db に変更します。

                                                図 3-4 neo4j デフォルト データベースの変更

3.2.4 Neo4j Web バージョンの実行と開始

まず、NEO4J_HOME\bin\ と入力し、cmd を開き、neo4j.bat.console と入力して neo4j Web ページを実行し、ローカルホスト アドレスを http://localhost:7474/ と入力して Web ページを表示します (図 3 を参照)。 -1。

     

                                          図 3-5 localhost での neo4j の起動 

3.3可視化と知識照会の操作

3.3.1ナレッジマップ全体を視覚化する

Neo4j ローカル Web ターミナルに「MATCH (n) RETURN (n)」と入力します。

                                            図 3-6 グラフの視覚化

3.3.2 知識のクエリ

たとえば、 Neo4j ローカル Web ターミナルでナイル川のヒナ、ペルーのアンチョビ、およびモザンビークの口のヒナの分布国と地域をクエリする場合は、次のように入力します。

MATCH p=()-->() RETURN p LIMIT 25 の場合は、下図のように入力します。

                                                       図 3-7 ナレッジクエリ

おすすめ

転載: blog.csdn.net/blink182007/article/details/127574552