python 爬取网站获得一个网站的所有链接

其他 2019-01-01 18:26:47 阅读次数: 0

第一步，找个网站我这里就找行业里比较有名的收录网站的网站酷113网

第二步，打开www.ku113.com 按下鼠标右键点击查看源码

第三步，把源码复制下来保存成一个文件命名 ku113.html

第四步，执行以下python 程序我这里用的py 2.7.13版本

#coding:utf-8
import re
from bs4 import BeautifulSoup

with open(‘ku113.html’,‘r’) as f:
data = f.read()
#print (data)
result = re.findall(r"(?<=href=").+?(?=")|(?<=href=’).+?(?=’)",data)
#print result

for each in result:
print (each)

猜你喜欢

转载自blog.csdn.net/u012421714/article/details/85494784

python 爬取网站获得一个网站的所有链接

python爬取一个网站（一)--------下载html

python之简单爬取一个网站信息

怎样用python3爬取电子书网站所有下载链接

python爬虫实战，干翻一个网站，爬取资源链接并用多线程下载！

用单进程、多线程并发、多线程分别实现爬一个或多个网站的所有链接，用浏览器打开所有链接并保存截图 python

python 实现爬取网站下所有URL

python爬取古诗文网站诗文一栏的所有诗词

利用python爬取分享网站链接

python3.6+scrapy 1.5爬取网站一个简单实例

python爬虫入门10分钟爬取一个网站

一个非常简单的爬取网站图片的Python爬虫实例

用Python爬取斗鱼网站的一个小案例

python scrapy爬取网站数据一

请用 python+selenium 爬取 XXX 网站上的所有a链接的 href属性并访问，输出访问地址和状态码

一个菜鸟python网络爬虫入门学习记录——从爬取网站图片开始学习python（1）

python爬取网站上所有诗句（第二版）

python3爬取新闻网站的所有新闻-新手起步

Python3 实现爬取网站下所有URL方式

Python爬虫—爬取某网站上面所有的世界港口信息数据

python爬某视频网站将网站下所有视频链接保存到TXT文件

Python练习三:爬虫练习,从一个提供免费代理的网站中爬取IP地址信息

用Python实现一个爬虫爬取ZINC网站进行生物信息学数据分析

[Python]爬取mzitu网站

Python爬取网站数据

Python爬取网站图片

python 爬取网站图片

第一个Python爬虫，爬取某个新浪博客所有文章并保存为doc文档

Python爬虫：爬一个很多小姐姐壁纸的网站，有点紧张（附源码！）

python爬虫入门---获取某一网站所有超链接

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)