将新浪新闻首页所有新闻爬取下来 - 代码天地

将新浪新闻首页所有新闻爬取下来

其他 2018-06-26 06:06:40 阅读次数: 3

'''将新浪新闻首页所有新闻爬取下来'''
import urllib.request
import urllib.error
import re


#模拟请求头
headers={
'User-Agent':"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) "
             "Chrome/49.0.2623.112 Safari/537.36"
}
#设置请求体
req=urllib.request.Request('https://news.sina.com.cn/',headers=headers)
response=urllib.request.urlopen(req)
data=response.read().decode('utf-8','ignore')
#正则表达式
pat='href="(http://news.sina.com.cn/.*?)"'
#新闻链接
urllists=re.findall(pat,data)
print(urllists)
for i in range(1,len(urllists)):
    time.sleep(3)
    try:
        file="C:/Users/Administrator/Desktop/news/"+str(i)+".html"
        urllib.request.urlretrieve(urllists[i],file)
    except urllib.error.URLError as e:
        if hasattr(e,'code'):
            print(e.code)
        if hasattr(e,'reason'):
            print(e.reason)

猜你喜欢

转载自blog.csdn.net/weixin_42141853/article/details/80761370

将新浪新闻首页所有新闻爬取下来

Python数据挖掘学习笔记（9）爬取新浪新闻首页的所有新闻

爬取新浪新闻

python爬取新浪新闻

python 爬取网页新浪新闻

BeautifulSoup语法笔记（爬取新浪新闻）

使用scrapy爬取新浪新闻

简单python爬虫爬取新浪新闻

Python爬虫爬取新浪新闻内容

爬虫：新浪详情新闻爬取总结

Webdriver 爬取新浪滚动新闻

python：爬取新浪新闻的内容

python爬虫：爬取新浪新闻数据

新浪新闻标题爬取

python3爬取新闻网站的所有新闻-新手起步

scrapy爬取新浪网导航页所有大类、小类、小类里的子链接，以及子链接页面的新闻内容

新浪网首页新闻资讯爬虫项目

python[爬虫]爬取百万条新浪新闻新浪滚动新闻中心(多进程)

Python之路__爬虫篇:新浪新闻爬取回顾（四）

Python之路__爬虫篇:新浪新闻爬取回顾（三）

Python之路__爬虫篇:新浪新闻爬取回顾（二）

Python之路__爬虫篇:新浪新闻爬取回顾（一）

BeautifulSoip+pandas 爬取新浪国内新闻

python-----爬新浪新闻标题链接

新浪网(sina)新闻链接爬取

爬取新浪社会新闻源代码

Python利用xpath和正则re爬取新浪新闻

Python3爬去新浪新闻写入mysql

新浪新闻API

新浪新闻全站

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)