大数据周会-本周学习内容总结013

开会时间:2023.05.07 15:00 线下会议

目录

01【fhzn项目】

02【将es中的json数据存储到mysql中】

03【老师点评】


01【fhzn项目】

  1. Docker
  2. Idea项目
    1. iNode智能客户端:先下载vpn,配置以后才能登录各个组件。
    2. maven私服替换。
  3. Java开发手册(黄山版).pdf
  4. 飞书
  5. mysql数据库中的数据表结构与字段

02【将es中的json数据存储到mysql中】

数据库版本要求:5.7及以上,5.7版本之后的mysql数据库支持json数据。

将多层的JSON数据存储到MySQL可以采用以下两种方法:

  1. 将JSON数据转换为字符串,存储在MySQL中的TEXT类型字段中。这种方法简单直接,但是查询和更新时需要手动解析JSON字符串,操作起来不够方便。
  2. 将JSON数据解析为表格形式,存储在MySQL中的多个表中。这种方法需要根据JSON数据的结构设计合适的数据表,但是可以更方便地进行查询和更新。

数据传输组件:

  1. Elasticsearch-jdbc
  2. Elasticsearch Logstash Plugin
  3. Apache NiFi

03【老师点评】

多层json、更新删除。基于jdbc来做,较为灵活,写个同步程序,更新删除的逻辑,数据不一致的修复,es与sql结构数据的安排,日志数据同步,自增id,二分查找快速定位。

基于jdbc来做多层json的更新删除。

DataEase

DataEase - 人人可用的开源数据可视化分析工具 - 官网

为拓展视野及团队技术积累,每周例会增加调研分析汇报。

每周调研内容:

  1. 数据采集(第一周)
  2. 数仓构建(场景(实时、离线)、组件、流程)(第二周)【元数据管理、主数据】
  3. 数据应用(BI、推荐)
  4. 计算(实时、离线)(第三周)
  5. 数据分析(质量、ETL、可视化)(第四周)
  6. 任务调度(第五周)

共享文档里以自己名字命名文件夹,二级文件夹按日期命名。
上传调研文档到共享文档,文档至少应包含以下模块,介绍、流程图(或加构图)。

数据平台、数据存储。

下周分享“数据采集”,流程图、架构图、使用场景,每人五分钟。

猜你喜欢

转载自blog.csdn.net/weixin_44949135/article/details/130670114