1、準備クローラ
2、プロジェクトの構成を変更
プロジェクト設定ファイルscrapy.cnfを検索し、ほどくのURLをコメントされます
このコードは、データベースに接続され、対応する構成データベースを変更する必要があります
実際には、データベース内のアドレスは、リモート・データベース・サーバーのアドレスに変更する、scrapyサーバを確保する必要性は、データベース・サーバーに接続することができます
3、展開プロジェクト
scrapydサービスを確保するためのプロジェクトを展開する前にオンになっています。
地元の爬虫類工学のディレクトリを入力します。
対応する展開コマンドの実行
4、スケジューリング爬虫類
スケジューリングはカールクローラを必要とし、次のコマンドは、プロジェクトディレクトリのDOSウィンドウに対応することができ、コマンド行のpycharmで実行することができます
4.1、爬虫類上記リモートサーバを表示します
カールます。http:// node100:6800 / listprojects.json
4.2、爬虫類エンジニアリングの上に展開され、リモート・サーバを削除
カールます。http:// node100:6800 / delproject.json -dプロジェクト= doubanSpider
4.3、爬虫類を開始
カールます。http:// node100:6800 / schedule.json -dプロジェクト= doubanSpider -dクモ= douban
4.4キャンセル爬虫類
カールのhttp:-dプロジェクト//node100:6800/cancel.json = doubanSpider -d仕事= 000f47e035e911e9a8e90bb05244259f