【Mycat 发展遇到的瓶颈问题】 - 代码天地

【Mycat 发展遇到的瓶颈问题】

企业开发 2018-05-11 23:00:00 阅读次数: 1

这两个问题不但是目前Mycat遇到的问题，也是分布式其他系统遇到的问题，解决方案只能寻求折中，要么时间换空间，要么空间换时间。

1、多重聚合问题

比如我有一个日志表：部门、用户、模块、访问时间..........，现在有一个如下的需求：实时统计哪个部门哪个用户，在某一个时刻，访问哪个系统模块最多。

select

部门、用户、访问时间、模块、 count(*) as cn

from 某个表

group by 部门、用户、访问时间、模块

order by cn desc

遇到海量数据的时候，mycat直接歇菜了

2、深度分页问题

在集群系统中深度分页

为了理解为什么深度分页是有问题的，让我们假设在一个有5个主分片的索引中搜索。当我们请求结果的第一页（结果1到10）时，每个分片产生自己最顶端10个结果然后返回它们给请求节点(requesting node)，它再排序这所有的50个结果以选出顶端的10个结果。

现在假设我们请求第1000页——结果10001到10010。工作方式都相同，不同的是每个分片都必须产生顶端的10010个结果。然后请求节点排序这50050个结果并丢弃50040个！

你可以看到在分布式系统中，排序结果的花费随着分页的深入而成倍增长。这也是为什么网络搜索引擎中任何语句不能返回多于1000个结果的原因。

为什么请求第1000页——结果10001到10010需要返回10010个结果？

因为根据不同的维度统计，你的每一条数据在整个系统中的排序位置不清楚，所以需要汇聚每个机器10010的结果，来做最后的排序。

猜你喜欢

转载自gaojingsong.iteye.com/blog/2339589

【Mycat 发展遇到的瓶颈问题】

MyCat遇到的坑

mycat使用问题汇总

mycat

[Mycat]

Mycat修改空指针问题

mycat 1.6.6.1 distinct报错问题

Mycat1.5卡死问题

mycat 主键自增问题

分享Mycat实战使用过程遇到的问题

关于windows下使用Mycat版本的问题？

MyCat + MySQL 主从部署问题汇总

Mycat 使用问题一则通过mycat插入，却不能查询

Mycat概述 mycat 概述

MyCat（1.2）Mycat的安装

Mycat之——Mycat的限制

生产上遇到的一例mycat读写分离延时问题

Mycat常见问题与解决方案

Mycat、HAProxy、Keepalived整合高可用（有点问题）

CPU性能发展所遇到的瓶颈

mycat 学习

Mycat 入门

mycat文档

mycat安装

MyCat的启动

Mycat 配置

MyCat 简介

mycat 使用

Mycat测试

Mycat简介

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)