初次尝试爬虫 - 代码天地

初次尝试爬虫

其他 2020-05-02 15:19:36 阅读次数: 0

其实吧，本来这次爬虫作业是想做其他网页的……

为什么没做呢？直接上图吧……

……这个网页不让扒！不让扒！不让扒！也可能是我没找对方法吧……无妨，换一个网页继续吧

于是我就把目光投向了现在唯一打开的网页：咱们的班级

那就把咱们班级第一页的标题都爬下来吧。

但最开始，我的代码选择了借鉴同学的码。结果，是这样的……

这我就真是奇了怪了，于是，我选择再研究一番，发现

这个东西（现在是已经修改过的了）里的参数应该是这个问题的关键

做个爬虫，连源码都不看，这像话么？于是，利用了高效的资源（指百度）成功找到如何爬出源码，如图所示：

有一说一结果而言确实好用，效果如图所示：

然后，找到标题所在处，比如这个：

发现是在<h3></h3>里

那还等啥？填参数啊！

源代码如下：

import pandas as pd
import requests as rq
from bs4 import BeautifulSoup
ur1="https://edu.cnblogs.com/campus/academy/2020python?page=2"
r=rq.get(ur1)
try:
    r.raise_for_status()
    r.encoding=r.apparent_encoding
    message=r.text
except:
    print('ERROR')
soup=BeautifulSoup(message,'html.parser')
index=soup.find_all('h3')
for i in index:
    print(i.text)

效果如下：

猜你喜欢

转载自www.cnblogs.com/li020108/p/12818134.html

初次尝试爬虫

springboot初次尝试

MXNet初次尝试 ---- MNIST

Google AMP 初次尝试

Oracle函数初次尝试

Shiro初次尝试

NiceVieoPlayer 初次尝试

lintcode初次尝试

markdown初次尝试

Flutter 初次尝试

Python初次尝试

Manacher算法初次尝试

初次尝试轮播图

【记录学习】初次尝试

初次尝试OpitX +CMake

爬虫尝试

android studio初次使用尝试

day1初次尝试

初次尝试xgboost，先跑通

初次尝试使用VisualSFM记录

初次使用github的艰难尝试。

团队远程协作的初次尝试

Unity Shader Graph初次尝试

爬虫-初次接触

python 单元测试之初次尝试

PS插件CameraRaw-初次尝试

mysql5.7虚拟列初次尝试

1.0操作系统的初次尝试

初次尝试vue脚手架

安装python以及初次尝试taichi

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)