Python 简单爬取网页数据 - 代码天地

Python 简单爬取网页数据

其他 2021-01-28 11:23:00 阅读次数: 0

爬取我的CSDN网页：https://blog.csdn.net/zhaoweiya
import requests 时出现红线，这时候，我们将光标对准requests，按快捷键：alt + enter，pycharm会给出解决之道，这时候，选择install package requests，pycharm就会自动为我们安装了，我们只需要稍等片刻，这个库就安装好了。lxml的安装方式同理

import requests
from lxml import etree
header = {
    
    "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.130 Safari/537.36"}
html = requests.get("https://blog.csdn.net/zhaoweiya",headers=header)
etree_html = etree.HTML(html.text)
content = etree_html.xpath('//*[@id="articleMeList-blog"]/div[2]/div/h4/a/text()')
for each in content:
    replace = each.replace('\n', '').replace(' ', '')
    if replace == '\n' or replace == '':
        continue
    else:
        print(replace)

截取了部分结果：

找出列表list中的重复元素
Python列表去重的多种方法
python+selenium滚动条/内嵌滚动条循环下滑，判断是否滑到最底部
Python特殊函数lambdamapfilter
Python嵌套函数和装饰器
python正序循环使用remove和delect删除报index溢出错误
decimal报错：decimal.InvalidOperation:[＜class‘decimal.ConversionSyntax‘＞]

参考：https://blog.csdn.net/IT_XF/article/details/82184585

猜你喜欢

转载自blog.csdn.net/zhaoweiya/article/details/109584565

Python 简单爬取网页数据

Python爬取网页数据

爬取网页数据python

python初学-爬取网页数据

使用 Python 爬取网页数据

python爬取网页数据方法

Python-爬取HTML网页数据

python之爬取网页数据总结（一）

python：Requests+正则爬取网页数据

python 爬取网页数据并进行保存

Python之requests爬取网页数据案例。

如何用python爬取网页数据,python爬取网页详细教程

python爬取网页的方法总结,python爬虫获取网页数据

python爬虫教程：实例讲解Python爬取网页数据

Python 爬取网页数据（以基金净值数据为例子）

Python 爬虫爬取多页数据

Python3.5-爬虫实战-爬取网页数据并且导入excel

Python3~Scrapy框架爬取网页数据到MySql~pipelines.py

Python3+Selenium爬取动态网页数据

你以为Python爬虫只能爬取网页数据吗？APP也是可以的呢！

Python爬虫项目：爬虫爬取BeautifulSoup模块分析网页数据

接着上次的python爬虫，今天进阶一哈，局部解析爬取网页数据

Python入门教程！手把手教会你爬取网页数据

python使用hyper爬取http2.0协议的网页数据

Python爬虫：为什么你爬取不到网页数据

照葫芦画瓢之python爬虫系列----（2）初次爬取简单的动态网页数据（网易、QQ音乐排行榜）

python爬取简单网页

Python For 和 While 循环爬取不确定页数的网页！

初识python 之爬虫：使用正则表达式爬取“糗事百科 - 文字版”网页数据初识python 之爬虫：使用正则表达式爬取”古诗文“网页数据

第十四周助教总结 python爬取动态网页数据，详解 CA-RNN论文读取 python爬取动态网页数据，详解 CA-RNN论文读取

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)