ウィキデータ処理

ウィキデータ処理

データへのアクセス

ダウンロードするには、最新の-all.json.bz2をページ上https://dumps.wikimedia.org/wikidatawiki/entities/

wgetのは、巨大なファイルをダウンロードするための最良のツールです。

wget -c -t 0 https://dumps.wikimedia.org/wikidatawiki/entities/latest-all.json.bz2

UbuntuでのNeo4jのインストール

この方法では不便であるスーパーバイザー権限を必要とします。

ステップ1.コンピュータにはJavaランタイム環境が存在しない場合は、まずOpenJREとOpenJDKのをインストールするには(オプション)。

$ sudo apt-get update
$ sudo apt-get install default-jre
$ sudo apt-get install default-jdk

ステップ2Neo4jをインストールします。

リポジトリを使用するにはソースのリストに追加します。

$ wget -O - https://debian.neo4j.org/neotechnology.gpg.key | sudo apt-key add -
$ echo 'deb https://debian.neo4j.org/repo stable/' | sudo tee /etc/apt/sources.list.d/neo4j.list
$ sudo apt-get update

最新のNeo4jコミュニティEditionをインストールするには:

$ sudo apt-get install neo4j

ユーザーインストール

Neo4jコミュニティ-3.5.8-unix.tar.gzからファイルを抽出するには

$ tar zxvf neo4j-community-3.5.8-unix.tar.gz

それは〜/ .bashrcのにフォローラインを追加し、「ソース」。

# neo4j
export NEO4J_HOME="/home/fyb/neo4j-community-3.5.8"
export PATH=$PATH:$NEO4J_HOME/bin

リモートアクセス権限を開きます。

$ vi neo4j-community-3.5.8/conf/neo4j.conf

change #dbms.connector.http.listen_address=:7474
to dbms.connector.http.listen_address=0.0.0.0:7474

change #dbms.connector.bolt.listen_address=:7687
to dbms.connector.bolt.listen_address=0.0.0.0:7687

サービスを開始するには、 トップレベルのディレクトリには、のNeo4jコミュニティ-3.5.8をするために呼ばれています

$ neo4j console

NodeJsのインストール

Node.jsのv12.x:

$ curl -sL https://deb.nodesource.com/setup_12.x | sudo -E bash -
$ sudo apt-get install -y nodejs

インポート

我々は採用ウィキデータ-のNeo4j-輸入のNeo4jにウィキデータをインポートするに。

https://github.com/findie/wikidata-neo4j-importer

いくつかの要件は、インストールする必要があります。

$ npm install neo4j-driver async n-readlines cli-color slugify

今、私たちはのNeo4jにウィキデータをインポートするindex.jsを実行することができます!

$ node index.js

参考文献

http://debian.neo4j.org/

https://github.com/nodesource/distributions/blob/master/README.md#deb

https://neo4j.com/download-thanks/?edition=community&release=3.5.8&flavour=unix

おすすめ

転載: www.cnblogs.com/fengyubo/p/11264997.html