Pythonは、あなたがしたい画像にクロール、簡単な爬虫類を作成します

日々のインターネット閲覧では、私たちはしばしば、我々は、デスクトップの壁紙または実行するために、または材料の設計を行うために使用するユーザーをダウンロードするには、これらの画像を保存したい、いくつかの素晴らしい写真を参照してください。

私たちの最も一般的な方法は、マウスの右ボタン経由で、名前を付けて保存]を選択します。しかし、マウス右の時間ではなく名前を付けて保存オプションのいくつかの写真は、傍受のスクリーンショットツールを使用して伝承する方法がありますが、それは、画像の鮮明度を低減するであろう。まあ〜!実際には、あなたは非常に強力であり、右のページのソースコードを表示します。

私たちは、私たちが望むコードがローカルクロール、簡単な爬虫類のpythonを通じてこの機能を実現することができます。ここでは、そのような機能を実装するためのpythonを使用する方法を見です。

ページ全体のデータにまず、アクセス

まず、我々は最初の画像をダウンロードするには、ページ全体に関する情報を取得することができます。

getjpg.py

urllibはモジュールは、Webページを読み込むためのデータ・インタフェースを提供し、我々は、WWW上のデータを読み取り、FTP、ローカルファイルを読むのが好きことができます。まず、我々はgetHtml()関数を定義します。

ウェブサイトを渡されgetHtml()関数に、URLからデータを読み取るための()メソッドを読み込み、ページ全体をダウンロードしてください。プログラムの実装では、ページ全体のプリントアウトをカバーします。

第二に、所望のデータページのスクリーニング

Pythonは非常に強力な正規表現を提供し、我々は最初の仕事のためのPythonの正規表現の少しの知識を理解する必要があります。

我々はBaiduの場合はポストバーは、いくつかの素敵な壁紙、フロント部を介して、視聴者を発見しました。私のような、アドレスの絵が見つかりました:SRC = " http://imgsrc.baidu.com/forum ... JPG" pic_ext = "JPEG"を

次のようにコードを変更します。

我々はgetImg()関数は、接続する必要の絵のためにページ全体をスクリーニングするために使用されて作成しました。モジュール再主に正規表現が含まれています。

あなたは、Pythonを学習するプロセスに疑問や問題の多くを満たしている場合、あなたは227 -435-450を-qun追加することができます自由のためのソフトウェアビデオがあります

ページ全体のスクリプトのURLアドレスを実行することは、画像に含まれます。

第三に、ローカルにページフィルタデータを保存

画像のスクリーニングのために、次のようにコードを介してローカルループに保存したアドレス:

ここでコアは、ローカルurllib.urlretrieve()メソッドは、直接ダウンロード、リモート・データを使用することです。

通过一个for循环对获取的图片连接进行遍历,为了使图片的文件名看上去更规范,对其进行重命名,命名规则通过x变量加1。保存的位置默认为程序的存放目录。

程序运行完成,将在目录下看到下载到本地的文件。

做为一个过来人,我要告诉你请教前辈大牛真的很重要,可以让你少走很多的弯路,不要怕丢人,没面子,面子值几个钱?学到真本事才最重要。没有技能才叫真的没有面子。python技术分享,让你的前途不再迷茫。

推荐阅读:

零基础如何学习Python这门编程语言?

学习python12小时后,告诉你,学python真没你想的那么难!

编程学习,知识付费已是常事,知识变现更重要!

程序员的技能树,决定了一生职业的高度

更多互联网行业咨询,编程学习技能分享!关注公众号id: mtbcxx

おすすめ

転載: blog.csdn.net/weichen090909/article/details/90678616