この記事では、市販の参考のために使用してはならない学習です
シオマネキ+シミュレータを使用してクロール(ダウンロードビブラートAPP)+ pycharm
1.シオマネキ(自己Baiduのダウンロード)の最新バージョンをダウンロードし、設定
1.1。赤箱1に示すように赤いボックスダニに示すように、接続設定の横に、ダニ、HTTPSをメニューバー - 工具・オプション-HTTPS]をクリックします
1.2。HTTPSを再度バーをクリックし、アクションは2番目のオプションを選択しクリックしてください...これに、デスクトップのデスクトップに証明書を送信する(見つけるのは簡単、あなたがエミュレータをインストールする必要があります)
2.ダウンロードしてインストールシミュレータは、私はシミュレータ矢上を使用します
公式サイト:https://www.yeshen.com/
そして、他のページや、独自のメモリを変更。。。。
戻るデスクトップに2.1、パス図の赤箱を見て、シミュレータにドラッグし、あなただけの保存された証明書を見つけます。
2.2戻りシミュレータデスクトップ、検索に設定プルダウンを開く - セキュリティ - インストールするには、SDカードから選択 - 以下に示すようにインストールし、証明書を見つけ、ちょうどプロンプト入力します。
2.3、無線LANを見つけるために、シミュレータ行き、ボタンを押して、ネットワークを変更するために戻って、修正、ネイティブクエリIP、CMD入力IPCONFIGとして、IPv4のは、ローカルIPの背後にあります
3.シミュレータダウンロードアプリケーション市場のビブラートのApp、この設定が完了し、シミュレータを再起動し、シオマネキが要求パケットをキャッチするかどうかをテストします。
4.テストは要求をキャッチすることができます。その後、要求を分析します。
図5に示すように、本明細書では「ビブラートニックネーム」、「ビブラートID」、「プロフィール」図こうして返さ図キャプチャデータをクロールしている。2
6.あなたはシオマネキは、図3に示したものを追加して、自分のから離れて、自分でデータを保存使用してスクリプトを書くことができますので、ローカルにコピーを保存することはできません得られたデータは、スクリプトは、対応するデータが自動的にローカルファイルJSONに保存されている追加しました
7.以下は、自身が必要に応じて変更するシオマネキスクリプトです
IF(oSession.uriContains( "https://aweme-eagle-hl.snssdk.com/aweme/v1/user/")){
//上边的网址是你需要保存数据的网址开头的部分,网站修改的话需要及时修改url var strBody=oSession.GetResponseBodyAsString(); var sps = oSession.PathAndQuery.slice(-64,-54); //FiddlerObject.alert(sps) var filename = "E:/此处是本地路径" + "/" + sps + ".json"; var curDate = new Date(); var sw : System.IO.StreamWriter; if (System.IO.File.Exists(filename)){ sw = System.IO.File.AppendText(filename); sw.Write(strBody); } else{ sw = System.IO.File.CreateText(filename); sw.Write(strBody); } sw.Close(); sw.Dispose(); }
ページを表示するために、右折し、ユーザーをダウンオンにするかどうかをシミュレータで8ビブラート、スクリプトシオマネキは、自動的に必要なデータを保存します。フィギュア
9.あなたがデータをクロール多くの時間を取りたいときの質問は、手動でページをめくることは不可能ですので、シミュレータのオペレーションのアシスタントを使用するための時間が来ます。
9.1は、いくつかは、保存することを忘れない、断るあなたは、操作のシミュレータ連続サイクル、繰り返し回数をしたい、自分を認めています。
9.2。再生ボタンをクリックすると、自動的に動作サイクルを記録しますエミュレータは、シオマネキを下げてきた、新しいがキャッチ対応する、より多くの地元のJSONデータを持っていきます。
================================================== =====
基本的な操作が終わっやる、それを解決するためにどのようにJSONファイルを取得し、コードをノック今回は行きます。
================================================== =====
10。特定のコードを表示しないように、アイデアについて話しています。
10.1は、地元からリスト、JSONの循環リストにJSONファイルに移動します
JSONファイルの内容を読み込むための10.2 json.load()
10.3は、あなたがJSONに必要な情報を取ります。
10.4ストアは、私はExcelファイルを保存し、いくつかの問題があり、私はここの話を。
#エラーの特殊文字を格納する際に、ここでのコーデックのストレージと、ストレージのcsvはカオスの問題、解決策、右の使用メモ帳、保存したCSVファイルを開く名前を付けて保存]をクリックし、エンコーディング形式UTF-8を選択することをエンコードする。 コーデックで.Open( "./ douyin / douyin.csv"、 "A +"、エンコーディング= 'UTF-8')、F AS: ライター= csv.writer(F、方言= "エクセル") writer.writerow(L)
10.5は、データに登っ繰り返し、重複排除からあるだろう非常に簡単です、私はここに言うことはできません。
私はデータをクロール何を表示