爬取今日头条财经版块新闻 - 代码天地

爬取今日头条财经版块新闻

其他 2019-01-29 23:51:19 阅读次数: 0

使用jupyter编辑, etree爬取

进入头条财经新闻网页,无法获取原网页内容,在查看各个请求中发现一个url里包含新闻信息.信息都在data里

import requests
from lxml import etree
import json

url = "https://www.toutiao.com/api/pc/feed/?category=stock&utm_source=toutiao&widen=1&max_behot_time=0&max_behot_time_tmp=0&tadrequire=true&as=A1C51CD5E0C5598&cp=5C50D50599C8BE1&_signature=4tjOJQAAvpNI946lUObjM-LYzj"

headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3610.2 Safari/537.36",
    "Connection": "close"
}

response = requests.get(url=url,headers=headers)
response.encoding = "utf-8"
page_text = json.loads(response.text)  # 获取页面内容
# print(page_text)

data = page_text['data']  # 获取data
# print(data)
news_dict = {}  # 存放每条新闻信息的字典
news_list = []  # 存放所有新闻信息的列表
for news in data:
    news_dict['描述'] = news['abstract']
    news_dict['标题'] = news['title']
    news_dict['来源'] = news['source']
    news_dict['关键字'] = news['label']
    news_list.append(news_dict)
    news_dict={}

print(news_list)

猜你喜欢

转载自www.cnblogs.com/huangqihui/p/10336270.html

爬取今日头条财经版块新闻

python爬取今日头条新闻，js解密

python 爬取今日头条热点新闻

爬取今日头条

今日头条的爬取

Python爬虫——新闻热点爬取中国新闻网,今日头条，

python爬取今日头条图片

今日头条图片爬取(二)

今日头条图片爬取(一)

爬取今日头条短视频

Python3从零开始爬取今日头条的新闻【一、开发环境搭建】

Python3从零开始爬取今日头条的新闻【二、首页热点新闻抓取】

根据关键词使用scrapy爬取今日头条网站新闻各类信息和内容页

Python3从零开始爬取今日头条的新闻【三、滚动到底自动加载】

爬取新浪、网易、今日头条、UC四大网站新闻标题及内容

python爬取今日头条分析报告

分析Ajax爬取今日头条街拍美图

分析Ajax爬取今日头条街拍美景

爬取今日头条街拍美图

今日头条图片爬取和下载

今日头条的街拍图片的简单自动爬取

爬取今日头条街拍图片

详解python爬取今日头条街拍美图

爬取今日头条图片，可以输入页数

python：今日头条中街拍美图的爬取

python爬虫-谈谈今日头条（爬取图集）

Ajax爬取今日头条街拍美图

python爬取今日头条关键字图集

用Ajax爬取今日头条图片

用Ajax爬取今日头条图片集

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)