我的第一只爬虫 - 代码天地

我的第一只爬虫

其他 2018-10-06 09:40:14 阅读次数: 0

# Python小白的挣扎

# 大神轻锤
# 小白的第一个爬虫
# 求大神多指点

# 这里导入要先导入BeautifulSoup和requests
from bs4 import BeautifulSoup
import requests

# 这里是你要爬取的网页路径，我这里爬的是糗事百科
url = 'https://www.qiushibaike.com/pic/'
# 用requests.get方法获得网页，并把它存储
we_data = requests.get(url)
# 用BeautifulSoup 解析网页，用.text方法使得网页可读
soup = BeautifulSoup(we_data.text, 'lxml')
# 爬取的元素标签，（看其标签中共有属性）
titles = soup.select('div.content span')
# 爬取想要图片的链接（在图片路径没有设置宽度的情况下）
# 不要听信百度用煞笔正则，我研究了一上午正则，一直报错说正则不是str类型，我又研究怎么加转型
imgs = soup.select('div.thumb a img')
# 对比上面的，爬取想要的图片的链接（在图片路径有设置宽度的情况下）
# imgs = soup.select('img[width="200"]')
# 用循环输出结果
for title, imgs in zip(titles, imgs):
# 设置字典存放你爬取到的内容
data = {
# 用户输入的内容
'内容': title.get_text('span'),
# 用户上传的图片路径
'图片路径': imgs.get('src')
}
# 输出你爬到的东西
print(data)

# 下一遍研究怎么将图片下载到本地

猜你喜欢

转载自blog.csdn.net/qq_42293487/article/details/80653060

我的第一只爬虫

Python爬虫第三课：我的人生第一只爬虫

scrapy框架下第一只爬虫！

一只爬虫的旅途

由浅到深玩转Python爬虫(一)第一只爬虫

一只想成长的爬虫~~

一只C++爬虫

初学者教程：第一只爬虫——爬取招聘信息（一）

初学者教程：第一只爬虫——爬取招聘信息（三）

初学者教程：第一只爬虫——爬取招聘信息（二）

我是一只IT小小鸟

我是一只恋爱的蜗牛

我是一只勤劳的工蜂

论一只爬虫的自我修养5：正则表达式

论一只爬虫的自我修养2：实战+习题复习

论一只爬虫的自我修养11：Scrapy框架之初窥门径

论一只爬虫的自我修养9：异常处理

论一只爬虫的自我修养8：正则表达式4

论一只爬虫的自我修养7：正则表达式3

论一只爬虫的自我修养6：正则表达式2

论一只爬虫的自我修养3:隐藏+习题复习

《零基础入门学习Python》第055讲：论一只爬虫的自我修养3：隐藏

《零基础入门学习Python》第061讲：论一只爬虫的自我修养9：异常处理

《零基础入门学习Python》第054讲：论一只爬虫的自我修养2：实战

《零基础入门学习Python》第053讲：论一只爬虫的自我修养

Facebook爬虫它是我这些年付出心血最多的一只虫儿（附源码讲解）

一只node爬虫的升级打怪之路

一只猫

一只小狗

第一只脚进门：Android常用的布局学习

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)