Python爬虫抓取页面内容 - 代码天地

Python爬虫抓取页面内容

其他 2020-03-27 23:10:17 阅读次数: 0

博客园示例：Ctrl+Alt+L格式化代码

#coding:utf-8
import requests
from lxml import etree


def gettitle(url):
    html=requests.get(url)
    selector=etree.HTML(html.text)
    title=selector.xpath('//a[@id="cb_post_title_url"]/text()')
    return title[0]

def getcontent(url):
    html=requests.get(url)
    selector=etree.HTML(html.text)
    contentlist=selector.xpath('//div[@class="postBody"]/div/p/text()')
    contents=''
    for i in contentlist:
        contents=contents+"\n"+i
    return contents
print("请输入博客园文章的链接：")
url=input("")
print(gettitle(url))
print(getcontent(url))

发布了46 篇原创文章 · 获赞 9 · 访问量 3672

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_41896770/article/details/100099428

Python爬虫抓取页面内容

python线程抓取页面简单内容

python爬虫：抓取页面上的超链接

爬虫（一）抓取百度页面的内容

python简单爬虫实例3之猫眼网top100抓取特定内容（一个页面）

PHP抓取页面内容

Python爬虫，抓取淘宝商品评论内容

Python爬虫，抓取淘宝商品评论内容!

python 爬虫如何用selenium抓取网页内容

Python爬虫二：抓取京东商品列表页面信息

python | 爬虫笔记（七）- 动态渲染页面抓取Selenium

【爬虫学习笔记】用Python抓取指定页面

python爬虫14--Selenium动态渲染页面抓取

使用爬虫抓取网页内容

Python抓取网页内容

PyThon 抓取页面（入门）

python爬虫爬取异步加载网页信息（python抓取网页中无法通过网页标签属性抓取的内容）

python小玩家 Python爬虫，抓取淘宝商品评论内容

python爬虫之获取页面script里面的内容

Python爬虫爬取搜狗搜索到的内容页面

python爬虫教程：python抓取多种类型的页面方法实例

【Python3 爬虫】16_抓取腾讯视频评论内容

[Python3.x]网络爬虫（一）：利用urllib通过指定的URL抓取网页内容

python简单爬虫实例7之使用selenium通过标签抓取贴吧特定内容并保存

python简单爬虫实例6之通过标签抓取贴吧特定内容

Python爬虫使用Selenium+PhantomJS抓取Ajax和动态HTML内容

Python3学习(34)--简单网页内容抓取（爬虫入门一）

如何抓取页面中的节点内容

PHP cURL库函数抓取页面内容

[scrapy] 抓取页面内容-xpath css

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)