Python爬取网页title - 代码天地

Python爬取网页title

其他 2018-08-14 05:09:10 阅读次数: 0

from urllib.request import urlopen
from urllib.error import HTTPError,URLError
from bs4 import BeautifulSoup

引入BeautifulSoup

下面是getTitle函数

def getTitle(url):
    try:
        html=urlopen(url)
    except (HTTPError,URLError) as e:
        return None
    try:
        bsObj=BeautifulSoup(html.read())
        title=bsObj.body.h1
    except AttributeError as e:
        return none
    return title
title=getTitle("http://www.pythonscraping.com/pages/page1.html")
if title==None:
    print("Title could not be found!")
else:
    print(title)

猜你喜欢

转载自blog.csdn.net/HurryRabbit/article/details/79147910

Python爬取网页title

python爬取网页

python动态爬取网页

Python 爬虫爬取网页

Python爬取网页图片

python 爬取静态网页

python爬取网页（简易）

【python】爬取网页图片

python爬取网页信息

Python爬取网页内容

python爬取简单网页

python爬取网页视频

python爬取视频，进行下载，获取title和时长

Python - Python 简单爬取网页内容

python根据标签爬取网页信息

python爬取网页基本框架

python 爬取网页新浪新闻

python3爬取网页图片

python获取网页精准爬取数据

python爬取网页的通用代码框架

Python 爬取网页内容，转成PDF

python爬虫爬取淘宝网页

Python爬取网页转为PDF

python requests 简单网页文本爬取

python爬取动态网页的内容

Python爬取网页图片03

Python爬取网页图片02

Python爬取网页图片01

python爬取淘宝网页信息

Python爬取动态网页

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)