Python之路__爬虫篇:新浪新闻爬取回顾（三） - 代码天地

Python之路__爬虫篇:新浪新闻爬取回顾（三）

其他 2018-07-26 16:12:17 阅读次数: 0

获取首页分页 range(1, 2) 可以范围大一点

#3- 获取首页新闻分页 并拿出所有分页的新闻URL 并取得对应新闻的内容
import json

commonPage = 'http://api.roll.news.sina.com.cn/zt_list?channel=news&cat_1=gnxw&cat_2==gdxw1||=gatxw||=zs-pl||=mtjj&level==1||=2&show_ext=1&show_all=1&show_num=22&tag=1&format=json&page={}'

def getNewLists(commonPage):

    newsList = []

    for i in range(1, 2):
        newsPage = commonPage.format(i)
        # print(newsPage)

        reContent = requests.get(newsPage)
        reContent.encoding = 'utf-8'

        if reContent.status_code == 200:
            jsonData = json.loads(reContent.text)

            for newDic in jsonData['result']['data']:
                newsURL = newDic['url']

                #print(newsURL)

                newsList.append(getNewsDetail(newsURL))
        else:
            print('分页结束******')
            break

    return newsList

猜你喜欢

转载自blog.csdn.net/idlehand/article/details/79069643

Python之路__爬虫篇:新浪新闻爬取回顾（三）

Python之路__爬虫篇:新浪新闻爬取回顾（一）

Python之路__爬虫篇:新浪新闻爬取回顾（四）

Python之路__爬虫篇:新浪新闻爬取回顾（二）

Python爬虫爬取新浪新闻内容

简单python爬虫爬取新浪新闻

python爬虫：爬取新浪新闻数据

python[爬虫]爬取百万条新浪新闻新浪滚动新闻中心(多进程)

python爬取新浪新闻

python实现新浪新闻爬虫

爬虫：新浪详情新闻爬取总结

python 爬取网页新浪新闻

python：爬取新浪新闻的内容

python爬虫爬取新浪新闻的评论数以及部分评论

Python 新浪实时新闻爬虫

python针对新浪新闻国内新闻爬取的爬虫，存入mysql数据库，也可输出为txt文件

爬取新浪新闻

Python抓取新浪新闻数据（三）

【API爬虫】30分钟百万条新浪新闻信息爬取。python得极速之旅

python-----爬新浪新闻标题链接

Python利用xpath和正则re爬取新浪新闻

Python3爬去新浪新闻写入mysql

python3+urllib撸新浪滚动新闻爬虫

python爬虫——爬取汽车之家新闻

python爬虫之爬取腾讯新闻

python爬虫【二】爬取新闻

python爬虫实战——爬取腾讯新闻！

爬虫 python 爬取澎湃新闻

Python爬虫 | 爬取环境新闻实战

Python数据挖掘学习笔记（9）爬取新浪新闻首页的所有新闻

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)