mysql 超1亿数据，优化分页查询 - 代码天地

mysql 超1亿数据，优化分页查询

数据库 2018-05-10 05:32:22 阅读次数: 0

my.ini参数

table_cache=512
bulk_insert_buffer_size = 100M
innodb_additional_mem_pool_size=30M
innodb_flush_log_at_trx_commit=0
innodb_buffer_pool_size=207M
innodb_log_file_size=128M

innodb_flush_log_at_trx_commit默认值1的意思是每一次事务提交或事务外的指令都需要把日志写入（flush）硬盘，这是很费时的。特别是使用电池供电缓存（Battery backed up cache）时。设成2对于很多运用，特别是从MyISAM表转过来的是可以的，它的意思是不写入硬盘而是写入系统缓存。日志仍然会每秒flush到硬盘，所以你一般不会丢失超过1-2秒的更新。设成0会更快一点，但安全方面比较差，即使MySQL挂了也可能会丢失事务的数据。而值2只会在整个操作系统挂了时才可能丢数据。对于事务要求很强，设置为0 是存在安全问题的

mysql创建表

CREATE TABLE `news` (
  `id` int(19) NOT NULL AUTO_INCREMENT,
  `title` varchar(30) DEFAULT NULL,
  `content` varchar(400) DEFAULT NULL,
  `type` varchar(30) DEFAULT NULL,
  PRIMARY KEY (`id`),
  UNIQUE KEY `PK_NEWS_ID` (`id`),
  KEY `INDEX_NEWS_ID_TYPE` (`id`,`type`),
  KEY `INDEX_NEWS_TYPE` (`type`)
) ENGINE=InnoDB AUTO_INCREMENT=1072779 DEFAULT CHARSET=utf8

java插入测试数据代码放到文章最后面

mysql5.5 支持 insert into mytable value (xxx,xxx....),(xxx,xxx....)...........插入多条记录，相比addBatch 好不到哪里，而且mysql数据包有限制，超大字符串对JVM也很难消受

查询随着select字段增多会消耗更多时间，limit a,b 也会随着a的增大而加大查询时间。

现在数据已经添加到了至少6200万条数据，

in的速度是惊人的

可见复合索引带来性能的优势

这个表大约是6200万条记录，综合一下2个最重要的速度最快查询 就是分页的查询语句

大表查询总结： 1 复合索引好好使用 2 in 要好好使用

上面的都是传统分页的，分页做下改进

1 当页面传到controller层有一个page对象，代表要查询的页数，那么我们的sql可以随着变化

start=(page-1)*pagesize+1 然后是where做限制就是where加上 id >= start

如果表中增加了一个type='ios8' 因为ios8 的数据是从三千多万多条开始的，假设是32888888条记录，后面才增加type='ios8'的记录，那么分页就可以加上 id >= start + 32888888

2 对于新闻类，老的数据分页是固定的，所以可以分表，新闻就要新闻

所以最新的新闻的分页好办，表里面弄几百页就够了，其他的数据放到一个老数据表里面，老数据表的存储引擎改成MyISAM

比如前500页就查询news的数据，后面的就查询oldnews1，oldnews2.....表的数据，对old表做一下策略每个old表的一种分类只允许有100000页的数据。

假设oldnew1表，是数据里面最先入进去的，是知道id的范围的，但是oldnews1表分页的页数是会变的

我们在老数据表每个表里面都增加一个page字段，存储页数，由于页数是会变动的，所以我们需要页码字段和数据倒着来，那么插入的时候就不会改动前面的页码的，我们知道有多少个老表。假设有10个老表

limit a,b,那么a就会大于 (news表的总页数*pagesize-news表的总条数+ 9*100000*pagesize)，查询页码的时候就需要-100000+1，因为页码字段是倒着来的.

3 上面分表+页码策略做的话性能会明显的提升很多，但是表中有大字段而且字段超多始终会对性能产生影响，老新闻是不变的，可以做静态化处理，我们新增一个路径表urloldnew1,.....，只给一个id,page,url即可,查询的时候就用这样就可以让表的数据字段大大减少，不去查询老的原始数据表。

url是生成的静态文件地址，这需要静态化的时候进行二次加密，根据文件路径生成加密码，然后根据加密码生成静态路径。

4 下面对单条新闻设计。

查询单条新闻：

看到的类似于 www.myblog.com/s/blog_s897yu_99uiiu_s7yht.html

这是经过加密的，后台要解密前台传递过来的字符串

如jkser896 _ 89hhgii _ oiy67hjk

根据字段表再次解密 java开发者 _ /news/old8/ 1243546678

这样拼接路径就成了。

最后把java插入测试数据放到附件里

---- 数据已经增加到了一个亿多，分页查询性能丝毫不减，Mysql竟然如此精悍

听大婶们说in不走索引的啊，看看大婶们对吗？in里面放一万个

猜你喜欢

转载自maclab.iteye.com/blog/2265492

mysql 超1亿数据，优化分页查询

Mysql利用覆盖索引优化分页查询

mysql数据库分页查询优化

MySQL百万级数据分页查询及优化

mysql分页查询优化

MySQL 分页查询优化

Mysql的分页查询优化

mysql千万级测试1亿数据的分页分析测试

mysql分页查询优化,大数据量优化

MYSQL（五）-----分页查询及优化

MySQL分页查询性能优化

Mysql优化大分页查询

MySQL分页查询的性能优化 MySQL单表百万数据记录分页性能优化

MySQL利用延迟关联或者子查询优化超多分页场景(MySQL offset)

二、mysql索引优化分析(1)

mysql数据库百万级记录查询分页优化

MySQL大数据量分页查询及优化

MySql 大数据量分页查询优化

MySQL处理千万级数据分页查询的优化方案

sql优化之大数据量分页查询（mysql）

MySQL 百万级数据量分页查询如何优化？

mysql百万级数据分页查询缓慢优化方法

mysql千万级数据分页查询性能优化

MYSQL百万级数据分页查询优化实战

MySQL大量数据量分页查询优化方案

mysql大数据使用limit分页查询优化

MySQL优化--1亿条数据效率COUNT(*)

MySQL——优化嵌套查询和分页查询

MySQL 分页查询优化——延迟关联优化

Mysql学习-04 索引优化分析--查询优化

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)