python初学-爬取网页数据

其他 2018-12-27 10:31:04 阅读次数: 0

python初学-爬取网页数据

1,获取网页源代码

import urllib
url = 'http://www.163.com'

wp = urllib.urlopen(url)
file_content = wp.read()

print file_content

2,将网页内容存入文件中

fp = open('163.txt', 'wb') #打开一个文本文件

fp.write(file_content) #写入数据

fp.close() #关闭文件

3，利用正则表达式快速的打印出网页的标题跟链接地址

import re
fp = open('163.txt', 'rb')
content = fp.read()
fp.close()

title = re.search('<title>(.*?)</title>', content, re.S).group(1)

print 'title = ', title + '\n'

hrefPatten = 'href="(.*?)"'

hrefC = re.findall(hrefPatten, content, re.S)  #返回所有匹配正则表达式的值于列表中

print 'Allhref = ', hrefC

for h in hrefC :
    print h

只是示例代码，演示爬取简单内容的简单过程，程序不完善，谢谢阅读，有不明白的可以回复讨论。

猜你喜欢

转载自blog.csdn.net/guo_hongjun1611/article/details/50440227

python初学-爬取网页数据

Python爬取网页数据

爬取网页数据python

使用 Python 爬取网页数据

python爬取网页数据方法

Python 简单爬取网页数据

Python-爬取HTML网页数据

python之爬取网页数据总结（一）

python：Requests+正则爬取网页数据

python 爬取网页数据并进行保存

Python之requests爬取网页数据案例。

如何用python爬取网页数据,python爬取网页详细教程

正则爬取网页数据(二)

正则爬取网页数据(三)

java网页数据爬取

如何快速爬取网页数据

jsoup爬取网页数据

Scrapy爬取网页数据

Java爬取网页数据

爬取网页数据基础

使用XPath爬取网页数据

python爬取网页的方法总结,python爬虫获取网页数据

爬网页数据

Python 爬虫爬取多页数据

python爬虫教程：实例讲解Python爬取网页数据

Python 爬取网页数据（以基金净值数据为例子）

Python3.5-爬虫实战-爬取网页数据并且导入excel

Python3~Scrapy框架爬取网页数据到MySql~pipelines.py

Python3+Selenium爬取动态网页数据

你以为Python爬虫只能爬取网页数据吗？APP也是可以的呢！

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)