通常,我們會采用ORDER BY LIMIT start, offset 的方式來進行分頁查詢。例如下面這個SQL:
| SELECT * FROM `t1` WHERE ftype=1 ORDER BY id DESC LIMIT 100, 10; |
或者像下面這個不帶任何條件的分頁SQL:
| SELECT * FROM `t1` ORDER BY id DESC LIMIT 100, 10; |
一般而言,分頁SQL的耗時隨著 start 值的增加而急劇增加,我們來看下面這2個不同起始值的分頁SQL執行耗時:
| yejr@imysql.com> SELECT * FROM `t1` WHERE ftype=1 ORDER BY id DESC LIMIT 500, 10;…10 rows in set (0.05 sec)yejr@imysql.com> SELECT * FROM `t1` WHERE ftype=6 ORDER BY id DESC LIMIT 935500, 10;…10 rows in set (2.39 sec) |
可以看到,隨著分頁數量的增加,SQL查詢耗時也有數十倍增加,顯然不科學。今天我們就來分析下,如何能優化這個分頁方案。 一般滴,想要優化分頁的終極方案就是:沒有分頁,哈哈哈~~~,不要說我講廢話,確實如此,可以把分頁算法交給Sphinx、Lucence等第三方解決方案,沒必要讓MySQL來做它不擅長的事情。 當然了,有小伙伴說,用第三方太麻煩了,我們就想用MySQL來做這個分頁,咋辦呢?莫急,且待我們慢慢分析,先看下表DDL、數據量、查詢SQL的執行計劃等信息:
| yejr@imysql.com> SHOW CREATE TABLE `t1`;CREATE TABLE `t1` ( `id` int(10) unsigned NOT NULL AUTO_INCREMENT,... `ftype` tinyint(3) unsigned NOT NULL,... PRIMARY KEY (`id`)) ENGINE=InnoDB DEFAULT CHARSET=utf8;yejr@imysql.com> select count(*) from t1;+----------+| count(*) |+----------+| 994584 |+----------+yejr@imysql.com> EXPLAIN SELECT * FROM `t1` WHERE ftype=1 ORDER BY id DESC LIMIT 500, 10/G*************************** 1. row *************************** id: 1 select_type: SIMPLE table: t1 type: indexpossible_keys: NULL key: PRIMARY key_len: 4 ref: NULL rows: 510 Extra: Using whereyejr@imysql.com> EXPLAIN SELECT * FROM `t1` WHERE ftype=1 ORDER BY id DESC LIMIT 935500, 10/G*************************** 1. row *************************** id: 1 select_type: SIMPLE table: t1 type: indexpossible_keys: NULL key: PRIMARY key_len: 4 ref: NULL rows: 935510 Extra: Using where |
可以看到,雖然通過主鍵索引進行掃描了,但第二個SQL需要掃描的記錄數太大了,而且需要先掃描約935510條記錄,然后再根據排序結果取10條記錄,這肯定是非常慢了。 針對這種情況,我們的優化思路就比較清晰了,有兩點:
1、盡可能從索引中直接獲取數據,避免或減少直接掃描行數據的頻率
2、盡可能減少掃描的記錄數,也就是先確定起始的范圍,再往后取N條記錄即可
據此,我們有兩種相應的改寫方法:子查詢、表連接,即下面這樣的:
#采用子查詢的方式優化,在子查詢里先從索引獲取到最大id,然后倒序排,再取10行結果集
新聞熱點
疑難解答