千万级别数据实时复杂统计效率优化 - 代码天地

千万级别数据实时复杂统计效率优化

其他 2021-03-09 06:53:39 阅读次数: 0

有个业务需求：千万级别数据，要根据位置、白天出现时间、晚上不出现时间，出现次数大于某个范围的复杂组合统计。

mysql在千万级别的数据时，查询效率就有明细的下降。而时间数据从上千万级上升到上亿级，查询效率很慢，等待很久。

除了加索引等常规优化，想到用 shardingsphere 来分库分表，调研之后，发现
shardingsphere 不支持having等统计查询，对子查询支持也不是非常友好。ShardingSphere不支持的SQL操作（having等复杂统计及子查询）

后来发现这些数据，大部分数据其实是很难用到到，因为业务要统计大于多少次的，并按次数倒序，于是把那些出现次数少的进行删除，数据一下降到百万级别的，查询效率明细提升。

优化不光是考虑技术上的，一些技术难做到的，还要结合业务进行优化。

猜你喜欢

转载自blog.csdn.net/linweidong/article/details/106664468

千万级别数据实时复杂统计效率优化

Mysql千万级别数据存储优化

千万级别数据去重思路

mysql数据库千万级别数据的查询优化和分页测试

原创 mysql数据库千万级别数据的查询优化和分页测试

java千万级别数据生成文件思路和优化

BATJ解决千万级别数据之MySQL 的 SQL 优化大总结

BATJ解决千万级别数据之MySQL的SQL如何优化？本文详细讲解

一张千万级别数据的表想做分页，如何优化？

mysql百万到千万级别数据量的优化方案

千万级别数据迁移从耗时3天优化到半个个小时

Mysql 千万级别数据数据查询

千万级别数据表创建索引

Mysql千万级别数据批量插入insert

java千万级别数据处理 2 -千万级别FTP下载

如何提高数十亿级别数据量的查询效率？es 的搜索引擎大数据实战分析

大数据实时流统计实战

记录一次发送千万级别数量消息的定时任务优化

千万级别的数据库优化

mysql处理千万级别的数据优化

千万级别mysql数据表优化

百万级别数据库优化方案

10亿级别数据的es集群怎么优化

MYSQL千万级别数据量迁移Elasticsearch5.6.1实战

Solr8.0速成系列 | Solr挑战千万级别数据-备课细节 07

Mysql批量插入千万级别数据的配置和使用方式

2019最新某某《大数据实时流统计实战》

大数据实战-访问pv实时统计

ElasticSearch在数十亿级别数据下，如何提高查询效率？

ES在亿级别数据量下，如何提升查询效率？

今日推荐

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

虽然老乡鸡开源的不是代码，但背后的原因却让人很暖心

富文本编辑器 Quill 2.0 重磅发布，特性、可靠性与开发者体验大幅提升

周排行

SVN同步出现问题

解决 nginx 出现 413 Request Entity Too Large 的问题

第一节区块链服务BaaS的总体架构以及基本模块设计的一种方案

ITeye 2013年度盘点——社区赠书书单

IDEA / git 和github 的新手使用教程史上最简单的 IntelliJ IDEA 教程史上最简单的 GitHub 教程

测试工程方法：测试用例设计综合策略

Spark优化(三)：对多次使用的RDD进行持久化

使用STM32 ST-LINK Utility 设置读保护后不能运行

exgcd 解同余方程ax=b(%n)

Android使用脚本进行多渠道打包

每日归档

更多

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)

2024-04-15(42)

2024-04-14(0)

2024-04-13(119)