新しいスクリプト抽出機能を備えたCampanula 1.2.0がリリースされました

Campanulaは軽量で効率的なクローラーツールであり、シンプルな設定と便利な二次開発を備えています。jsによってレンダリングされたウェブページをクロールでき、あらゆるデータをクロールでき、ウェブページのスナップショットの保存、インテリジェントなアンチブロッキングをサポートし、自然に配布に適しています。

流行後の最初の更新バージョンとして、Campanulaは今回より多くの更新された機能を備え、スクリプトを介してカスタムデータ抽出機能を追加しました。これにより、抽出機能がより強力になります。

同時に、通常のユーザーがコンテンツページをより適切に判断できるように、コンテンツページ確認メカニズムが今回最適化されています。これにより、クロールする必要のあるデータのページをより簡単に特定でき、クロール効率がさらに向上します。

この更新の内容は次のとおりです。

1スクリプト抽出戦略を増やし、jsスクリプトを介してダウンロードされたWebページから要件を満たすデータ情報を抽出するためのサポート
2コンテンツページのマッチングルールとコンテンツページフィルターを増やし、コンテンツページの選択方法をより柔軟にします
3コードスタイルの最適化、コードの標準化、作成Alibabaの開発プロトコルとより一致しています
。4最適化されたシミュレーションテストインターフェイス、追加されたコンテンツ抽出テスト、リンク抽出、Webページダウンロード、コンテンツページルールテストインターフェイス
。5最適化されたコンテンツページ処理戦略と改善されたコンテンツページ処理パフォーマンス
。6最適化されたイベント監視インターフェイス、処理の詳細明らかに心に
7他のいくつかの最適化

ソースアドレス:https://gitee.com/zhiyubujian/wind-bell
APIドキュメント:https://apidoc.gitee.com/zhiyubujian/wind-bell/

おすすめ

転載: www.oschina.net/news/114879/wind-bell-1-2-0-released