ウィキデータ処理
データへのアクセス
ダウンロードするには、最新の-all.json.bz2をページ上https://dumps.wikimedia.org/wikidatawiki/entities/。
wgetのは、巨大なファイルをダウンロードするための最良のツールです。
wget -c -t 0 https://dumps.wikimedia.org/wikidatawiki/entities/latest-all.json.bz2
UbuntuでのNeo4jのインストール
リポジトリから(推奨しません)
この方法では不便であるスーパーバイザー権限を必要とします。
ステップ1.コンピュータにはJavaランタイム環境が存在しない場合は、まずOpenJREとOpenJDKのをインストールするには(オプション)。
$ sudo apt-get update
$ sudo apt-get install default-jre
$ sudo apt-get install default-jdk
ステップ2。Neo4jをインストールします。
リポジトリを使用するにはソースのリストに追加します。
$ wget -O - https://debian.neo4j.org/neotechnology.gpg.key | sudo apt-key add -
$ echo 'deb https://debian.neo4j.org/repo stable/' | sudo tee /etc/apt/sources.list.d/neo4j.list
$ sudo apt-get update
最新のNeo4jコミュニティEditionをインストールするには:
$ sudo apt-get install neo4j
ユーザーインストール
Neo4jコミュニティ-3.5.8-unix.tar.gzからファイルを抽出するには
$ tar zxvf neo4j-community-3.5.8-unix.tar.gz
それは〜/ .bashrcのにフォローラインを追加し、「ソース」。
# neo4j
export NEO4J_HOME="/home/fyb/neo4j-community-3.5.8"
export PATH=$PATH:$NEO4J_HOME/bin
リモートアクセス権限を開きます。
$ vi neo4j-community-3.5.8/conf/neo4j.conf
change #dbms.connector.http.listen_address=:7474
to dbms.connector.http.listen_address=0.0.0.0:7474
change #dbms.connector.bolt.listen_address=:7687
to dbms.connector.bolt.listen_address=0.0.0.0:7687
サービスを開始するには、
$ neo4j console
NodeJsのインストール
Node.jsのv12.x:
$ curl -sL https://deb.nodesource.com/setup_12.x | sudo -E bash -
$ sudo apt-get install -y nodejs
インポート
我々は採用ウィキデータ-のNeo4j-輸入のNeo4jにウィキデータをインポートするに。
https://github.com/findie/wikidata-neo4j-importer
いくつかの要件は、インストールする必要があります。
$ npm install neo4j-driver async n-readlines cli-color slugify
今、私たちはのNeo4jにウィキデータをインポートするindex.jsを実行することができます!
$ node index.js
参考文献
https://github.com/nodesource/distributions/blob/master/README.md#deb
https://neo4j.com/download-thanks/?edition=community&release=3.5.8&flavour=unix