python-----爬新浪新闻标题链接 - 代码天地

python-----爬新浪新闻标题链接

编程语言 2018-08-09 17:57:26 阅读次数: 0

import re
import urllib.request
import io
import sys
import requests
sys.stdout = io.TextIOWrapper(sys.stdout.buffer,encoding='utf-8')#改变输出的编码。如无乱码问题可不写
response = requests.get('http://roll.news.sina.com.cn/news/gnxw/gdxw1/index.shtml')
response.encoding = 'gbk'
html = response.text
# print(html)
pakage = re.findall(r'<li><a (.*?)</span></li>',html)
pakages = '\n'.join(pakage)
# print(pakages)
replace1 = pakages.replace('href=','链接：')
replace2 = replace1.replace('target="_blank">','标题：')
result = replace2.replace('</a><span>','         时间：')
# print(result)
f_save = open('xinwen.txt','w')
f_save.write(result)
f_save.close()

自动生成txt文件。里面是本次爬的结果

猜你喜欢

转载自blog.csdn.net/weixin_40709439/article/details/81450142

python-----爬新浪新闻标题链接

新浪新闻标题爬取

多线程爬取新闻标题和链接

python爬虫之抓取网页新闻标题与链接

网络爬虫百度新闻标题及链接爬取

scrapy爬取新浪网站全栈新闻标题内容，并且分类存入文件夹中

爬取新浪、网易、今日头条、UC四大网站新闻标题及内容

python2爬取虎扑NBA的新闻标题和内容(入门勿喷)

爬取多个页面的新闻标题

网易首页新闻标题加二级页面新闻内容爬取工具：python+xpath

Java截取新闻标题

python爬取新浪新闻

数据采集（二）：腾讯新闻网，新闻标题和内容爬取

Scrapy框架入门之爬取虎扑体育的新闻标题

vfp9.0通过WebBrowser控件获取QQ新闻标题及链接

Python爬取ithome的一所有新闻标题评论数及其他一些信息并存入Excel中。

第三十四节新闻标题练习

CSS---浮动练习---新闻标题

Java教程:Java截取新闻标题

python 爬取网页新浪新闻

Python爬虫爬取新浪新闻内容

简单python爬虫爬取新浪新闻

python：爬取新浪新闻的内容

python爬虫：爬取新浪新闻数据

新浪网(sina)新闻链接爬取

Python爬虫案例2：获取抽屉网页所有的新闻标题并保存到csv

Python 实现Jaccard相似度计算，判断英文新闻标题相似度

爬取新浪新闻

python[爬虫]爬取百万条新浪新闻新浪滚动新闻中心(多进程)

爬虫任务一：使用httpclient去爬取百度新闻首页的新闻标题和url，编码是utf-8

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)