59-天亮大数据系列教程之练手小项目-APP热门标签分析

目录
一、项目背景与目标
二、需求分析
三、主要思路与考点

详情
一、项目背景与目标

  • 项目背景
    • 在移动APP满天飞的当下,如何做好APP的营销和推广至关重要,而该环节的关键在于能对APP做大众喜欢的关键字描述,从而提高APP的搜索命中率和下载率。

    • 找到热度标签,蹭热度标签,往往可以提高相应APP的下载量和使用量。

    • 项目目标

      • 用时不超过一周,主要是通过查看之前教学资料和视频,百度搜索等方式搞定,加强实战应用开发能力和自学能力。
      • 最终达到对于常用的小模块开发,可以在1-5天内迅速解决战斗,并形成自身的类库积累。

二、需求分析

  • 给定一批app名称及其描述信息,共52.9万条数据,天亮教育公开课资料链接:
    链接:https://pan.baidu.com/s/1Iu0FrjYIP1QtoL63_w48Ug 密码:899x 进入后的具体位置如下图所示:
    在这里插入图片描述
    • 其内容结构为,共包含6个字段,分别为(appId,app名称, 一级分类,二级分类,三级分类,Tags描述信息),但并不一定完全规整,视 实际情况可能左对齐包括四个或五个或六个字段。
    • 通过大数据开发之hive数据仓库命令行形式,完成数据加载、udf/udaf/udtf函数、统计分析的任务,并演示项目效果即可。

三、主要思路与考点

  • 主要思路
    • 通过hive命令将数据加到数据仓库中
    • 使用hql+udf/udaf/udtf完成统计分析
    • 将统计分析结果插入到hive中自建的新表中
  • 主要考点
    • 数据仓库的目录结构和开发规范
    • hive及HiveSQl常用命令
    • 系统函数+udf/udaf/udtf灵活使用
    • hive常见问题的解决


天亮教育是一家从事大数据云计算、人工智能、教育培训、产品开发、咨询服务、人才优选为一体的综合型互联网科技公司。
公司由一批BAT等一线互联网IT精英人士创建,
以"快乐工作,认真生活,打造高端职业技能教育的一面旗帜"为愿景,胸怀"让天下没有难找的工作"使命,
坚持"客户第一、诚信、激情、拥抱变化"的价值观,
全心全意为学员赋能提效,践行技术改变命运的初心。

更多学习讨论, 请加入
官方-天亮大数据交流-366784928
群二维码:
这里写图片描述
天亮教育公开课-从小白到大佬修成记-全系列视频地址:http://bbs.myhope365.com/forum.php?mod=viewthread&tid=1422&extra=page%3D1

欢迎关注天亮教育公众号,大数据技术资料与课程、招生就业动态、教育资讯动态、创业历程分享一站式分享,官方微信公众号二维码:
在这里插入图片描述

天亮教育官方群318971238,
爬虫、nlp技术qq群320349384
hadoop & spark & hive技术群297585251
教育培训官网:http://myhope365.com
项目研发业务尚云科技官网:http://shangyuninfo.com/
官方天亮论坛:http://bbs.myhope365.com/

猜你喜欢

转载自blog.csdn.net/erliang20088/article/details/86616997