python简单实现获取CSDN博客文章链接 - 代码天地

python简单实现获取CSDN博客文章链接

其他 2019-01-27 12:58:48 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/wingrez/article/details/86660913

from bs4 import BeautifulSoup
import urlparse
import urllib2
import re
 
if __name__=="__main__":
    pages=set()
    urls=set()
    startpage=1
    endpage=12
    
    for i in range(startpage, endpage+1):
        pages.add("https://blog.csdn.net/wingrez/article/list/%d?" % i )
    
    for page in pages:
        response=urllib2.urlopen(page);
        html_cont=response.read()
        soup=BeautifulSoup(html_cont, 'html.parser', from_encoding='utf-8')
        links=soup.find_all('a', href=re.compile(r'https://blog.csdn.net/wingrez/article/details/.*'))
        for link in links:
            urls.add(link['href'])
 
    for url in urls:
        print url
            
    print "Finish."

猜你喜欢

转载自blog.csdn.net/wingrez/article/details/86660913

python简单实现获取CSDN博客文章链接

python简单实现获取CSDN博客文章相关信息

PHP 获取CSDN博客的文章链接

NodeJS简单爬虫获取指定用户CSDN博客所有文章链接

Python爬虫获取Csdn文章

Python3 获取CSDN博客文章的阅读数和评论量

Python3 获取CSDN博客所有文章标题及阅读数

Python爬虫入门实战1：获取CSDN个人博客文章目录及阅读量数据

Python爬虫入门实战2：获取CSDN个人博客文章基础信息

文章位置：CSDN博客

打印csdn博客文章

python实例-通过cookie实现登录csdn获取自己微博的文章列表

python+shell 备份 CSDN 博客文章，CSDN博客备份工具

python+shell 备份 csdn 博客文章2 优化版

python+shell 备份 csdn 博客文章3 备份图片

Python+爬虫+xlwings发现CSDN个人博客热门文章

python爬取CSDN博客文章并制作成PDF文件

【python】将halo博客文章批量同步到csdn

python爬取个人csdn博客链接和标题

回归CSDN博客写文章

CSDN收藏别人的博客文章

csdn博客转载文章

抓取CSDN博客热门文章

如何爬取CSDN博客中分栏的所有文章的标题和链接

某大牛的csdn博客链接

CSDN博客链接地址

链接爬虫实战（CSDN博客）

Python 爬虫：requests + BeautifulSoup4 爬取 CSDN 个人博客主页信息（博主信息、文章标题、文章链接）爬取博主每篇文章的信息（访问、收藏）合法刷访问量？

python爬取博客圆首页文章链接+标题

python简单爬虫实例，爬取CSDN文章

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)