爬取美团网数据 - 代码天地

爬取美团网数据

其他 2019-03-04 19:24:41 阅读次数: 0

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
import requests

from lib.re_util import ReUtil

base_url = 'http://ns.meituan.com/meishi/b25710/'

cookies_str = '_lx_utm=utm_source%3Dgoogle%26utm_medium%3Dorganic; _lxsdk_cuid=169416ad3eec8-047ac50146444b-24414032-1fa400-169416ad3eec8; __mta=247371067.1551580718640.1551580718640.1551580718640.1; ci=547; rvct=547%2C20%2C406; _lxsdk=169416ad3eec8-047ac50146444b-24414032-1fa400-169416ad3eec8; mtcdn=K; client-id=0c7a0c6e-a2ae-4078-935c-09341ba89f12; lat=22.884164; lng=113.458377; userTicket=khcRUTMcyLDWOzCyHezncrrepAbXpqpxDHzQUdLl; u=274668244; n=BpY342261584; lsu=; token2=ge9zM0PLN0SCKhx2Pwe7MZzBwRoAAAAA_gcAALQDil5w1rLuttboIENK9gmMKE2ZJDAp8lyGAqOJ3Mu6opaoFQHf6u065s2tZaonxg; lt=ge9zM0PLN0SCKhx2Pwe7MZzBwRoAAAAA_gcAALQDil5w1rLuttboIENK9gmMKE2ZJDAp8lyGAqOJ3Mu6opaoFQHf6u065s2tZaonxg; uuid=e6b22bfb73b9426ba0c6.1551580712.2.0.0; unc=BpY342261584; _lxsdk_s=169483cec48-b6a-7bc-1de%7C%7C1'

cookies_dict = {}
for cookie in cookies_str.split(";"):
    k, v = cookie.split("=", 1)
    cookies_dict[k.strip()] = v.strip()

headers = {
    'User-Agent': 'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Ubuntu Chromium/71.0.3578.98 Chrome/71.0.3578.98 Safari/537.36'
}

page = requests.get(
    url=base_url,
    cookies=cookies_dict,
    headers=headers
)

def get_element_from_html(raw_html):
    regex = ReUtil.get_regex(begin_with=['"poiInfos":'], end_with=['},"comHeader"'])
    result = regex.findall(raw_html)
    print(result[0][1])
    ans = ""
    for i in range(4):
        ans += result[0][i]
    return result

get_element_from_html(page.text)

View Code

猜你喜欢

转载自www.cnblogs.com/liuweimingcprogram/p/10472391.html

美团网数据爬取

爬取美团网数据

如何爬取美团网美食！

爬取美团的数据的请求头

python爬取美团数据

爬取美团

爬取美团网美食数据，看北京上海都爱吃些啥

Python爬取美团网数据这么简单，别再说你不会了哦！

python爬虫练习爬取美团网酒店信息

python爬虫爬取美团西安美食数据

美团西安酒店数据爬取（Python）

爬取美团店铺数据（二）—— getPoiList接口调用

爬取美团店铺数据（一）—— token解析与生成

使用BeautifulSoup爬取无锡美团美食店铺数据

ip代理池 + sleep 爬取美团数据

人生苦短，用Python爬取美团网所有城市数据，朋友出价5000都不卖

Python 爬取美团酒店信息

python爬取美团评论

爬取美团网的美食点评信息（含页面分析过程）

Python爬虫入门【3】：美空网数据爬取

数据采集：selenium爬取美团全国酒店信息（一）

数据采集：selenium爬取美团全国酒店信息（四）使用代理

数据采集：selenium爬取美团全国酒店信息（三）

数据采集：selenium爬取美团全国酒店信息（二）

爬取Ajax动态加载网页--以美团为例

爬取美团评论—情感分析模型建立

python爬取美团评论做词云分析

Python两招轻松爬取美团评论

爬取美团店铺数据（三）—— 获取分页数据并存入MySQL数据库

拉勾网数据爬取

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)