大数据实战——微博舆情大数据分析 - 代码天地

大数据实战——微博舆情大数据分析

其他 2018-08-19 11:18:52 阅读次数: 0

CSDN 直播课程学习笔记

云端实验室环境
基于开源的ambari大数据平台，部署了7个节点：
这里写图片描述

一、项目背景

企业可能对用户在微博上的评价内容有监测需求，如活动效果、用户对产品的评价，用户关注于产品的价格还是功能等等。

本平台用来获取微博的数据（数据量大、非结构化数据），进行数据分析，存储在云平台，将结果输出给企业。

二、项目架构

这里写图片描述

1. 数据源

微博数据：
这里写图片描述

2. 数据层

本次数据层主要讲主数据仓库。
数据仓库是为应用层提供数据服务的。
这里写图片描述

数据仓库表设计
这里写图片描述

数据仓库一般是离线数据分析使用，每天要跑的固化需求。如果是临时需求（提数），就要让大数据开发人员专门做一条数据报表出来。

3. 平台层

这里写图片描述

ODS层：数据是清洗后的。

4. APP区

从数据仓库区取数据分析展示。

三、平台演示

运维人员一般使用Ambari，作为大数据的管理平台，而给开发人员使用跳板机（或堡垒机）。

开发界面示例：
这里写图片描述

select count(*) from web_log_192g

这里写图片描述

这里写图片描述

公司开发时，运维一般给不同团队分配不同队列，不同队列会有不同资源。
这里写图片描述

虽然Spark比较成熟，但大多数公司对离线分析还是用Hive多一些。

企业微博声量号的分析：
统计微博最新状态下被评论最多的Top10账户id，
注意：每个用户的微博进行去重之后，筛选出同一条微博的最新状态。

这里写图片描述
开发有两种方式，一种在Ambari web平台写脚本。

实际中使用引入一个开发平台。这里是Hue。
这里写图片描述

这里写图片描述

每天都要跑的定时任务，一般用这样的平台设置一些权限，
这里写图片描述

在这里写经常用的SQL
这里写图片描述

这里写图片描述

点击Save As，
这里写图片描述

这样平时开发的SQL都可以保存下来。
这里写图片描述

如果要执行，那要设计一个执行器：
这里写图片描述
企业中使用一般会针对这个界面进行二次开发
新建一个流程：

然后添加流程：

这里写图片描述
设置运行条件：

这里写图片描述

选择数据：
这里写图片描述

这里写图片描述

固定的报表一般会配置WorkFlow，这里使用Oozie作为工作流平台

这里写图片描述

猜你喜欢

转载自blog.csdn.net/xundh/article/details/80904730

大数据实战——微博舆情大数据分析

Hadoop实战：微博数据分析

5 大数据实战-hive实战分析

大数据Hive学习案例(3)——基于新浪微博的日志数据分析

ClickHouse大数据分析技术与实战

3 大数据实战系列-spark shell分析日志

【大数据实战】：知乎百万用户分析

大数据实时分析利器ClickHouse实战

大数据实战课程第一季Python基础和网络爬虫数据分析

大数据分析

智慧公安大数据分析平台搭建舆情监控平台开发

基于Python的微博大数据舆情分析，舆论情感分析可视化系统

【大数据微职位笔记】模块04-项目实战-NCDC气象数据分析

大数据实战视频分享

大数据实时处理实战

大数据实战（上）——环境搭建

大数据实战项目有哪些

大数据实战视频教程

大数据实时流统计实战

基于Hive的大数据实战项目

腾讯云大数据实战案例

大数据------数据分析

小象学院大数据分析与数据挖掘精华实战+数据分析数据挖掘实战

大数据——舆情监控系统

[Pyhon疫情大数据分析] 四.微博话题抓取及新冠肺炎疫情文本挖掘和情感分析

大数据实时分析应用

大数据实时分析架构

大数据实训2 - 法律咨询数据分析和服务推荐

BI 大数据分析

大数据分析过程

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)