BeautifuSoup库爬取美女图片

企业开发 2019-12-09 17:40:24 阅读次数: 0

爬虫模块(从网页上采集数据数据放置在网页标签里面)
1.requests2.BeautifuSoup3.urllib4.urllib25.scrapy6.lxml
爬取步骤
1.获取标签的内容
数据：<div> <title> <a> ....
找到标签里面的内容 soup.div

2.打开网页获取文件的内容
soup.prettify() //打印本地文件的内容

3.html源代码相同标签很多，怎么获取到我想要的那一部分内容
网页名字 class id find：查找标签
e = soup.find("div",class_="a").txt class是关键词所以要放置下划线

区分点：
find() find_all() 都是查找标签里面的内容 python 3.x print后面要加括号
在python3中，urllib2合并到urllib库中

字符串格式化的作用（为真实的值保留一个位置）

* coding:utf-8 *

from bs4 import BeautifulSoup #从网页抓取数据
import urllib3,urllib.request
x = 0;
urls = ['https://www.buxiuse.com/?page={}'.format(str(i)) for i in range(5,11)]
for url in urls:
def crawl(url): # 模拟浏览器加上headers
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36"}
req = urllib.request.Request(url, headers=headers) # 用地址创建一个request对象
page = urllib.request.urlopen(req, timeout=20) # 打开网页
contents = page.read() # 获取源码
soup = BeautifulSoup(contents, features="lxml")
my_girl = soup.find_all('img')
for girl in my_girl:
link = girl['src']
global x
urllib.request.urlretrieve(link, "image\%s.jpg" % x) # 下载
print("爬取完第" + str(x) + "张")
x += 1
crawl(url)

猜你喜欢

转载自blog.51cto.com/13550695/2457080

BeautifuSoup库爬取美女图片

美女图片爬取

爬取美女图片

用python爬取美女图片

python爬虫-爬取美女图片

python爬取美女图片

Scrapy爬取美女图片

爬取头条美女图片

Python 批量爬取美女图片

AotucCrawler 快速爬取美女图片

爬美女图片

利用协程asyncio爬取搜狗美女图片（一）——asyncio库的介绍和使用

python爬虫之美女图片爬取

分析ajax爬取搜狗美女图片

Python2爬取美女图片(mzitu)

requests-爬取美女图片源码

python协程爬取直播美女图片

TCP$UDP回顾，多进程爬取美女图片

再来玩爬取4K美女图片

Python爬取美桌网美女图片

宅男福利用Python爬取美女图片

用python爬取海量美女图片

使用爬虫xpath提取数据-爬取美女图片

Python瀑布流爬虫-爬取360美女图片+爬取百度美女图片（嘿嘿~）

爬取篇-利用python3爬取美女图片

爬天极网美女图片

千图网_性感美女图片爬取--图片懒加载

python3.7--爬取上万张妹子图-------美女图片--玉米都督

正则爬取海量美女图片(自动生成文件夹并储存)

聪哥哥教你学Python之如何爬取美女图片

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)