前言
之前在網上看到過很多關于mysql聯合索引最左前綴匹配的文章,自以為就了解了其原理,最近面試時和面試官交流,發現遺漏了些東西,這里自己整理一下這方面的內容。
最左前綴匹配原則
在mysql建立聯合索引時會遵循最左前綴匹配的原則,即最左優先,在檢索數據時從聯合索引的最左邊開始匹配,示例:
對列col1、列col2和列col3建一個聯合索引
| KEY test_col1_col2_col3 on test(col1,col2,col3); |
聯合索引 test_col1_col2_col3 實際建立了(col1)、(col1,col2)、(col,col2,col3)三個索引。
| SELECT * FROM test WHERE col1=“1” AND clo2=“2” AND clo4=“4” |
上面這個查詢語句執行時會依照最左前綴匹配原則,檢索時會使用索引(col1,col2)進行數據匹配。
注意
索引的字段可以是任意順序的,如:
| SELECT * FROM test WHERE col1=“1” AND clo2=“2”SELECT * FROM test WHERE col2=“2” AND clo1=“1” |
這兩個查詢語句都會用到索引(col1,col2),mysql創建聯合索引的規則是首先會對聯合合索引的最左邊的,也就是第一個字段col1的數據進行排序,在第一個字段的排序基礎上,然后再對后面第二個字段col2進行排序。其實就相當于實現了類似 order by col1 col2這樣一種排序規則。
有人會疑惑第二個查詢語句不符合最左前綴匹配:首先可以肯定是兩個查詢語句都保函索引(col1,col2)中的col1、col2兩個字段,只是順序不一樣,查詢條件一樣,最后所查詢的結果肯定是一樣的。既然結果是一樣的,到底以何種順序的查詢方式最好呢?此時我們可以借助mysql查詢優化器explain,explain會糾正sql語句該以什么樣的順序執行效率最高,最后才生成真正的執行計劃。
為什么要使用聯合索引
減少開銷。建一個聯合索引(col1,col2,col3),實際相當于建了(col1),(col1,col2),(col1,col2,col3)三個索引。每多一個索引,都會增加寫操作的開銷和磁盤空間的開銷。對于大量數據的表,使用聯合索引會大大的減少開銷!
覆蓋索引。對聯合索引(col1,col2,col3),如果有如下的sql: select col1,col2,col3 from test where col1=1 and col2=2。那么MySQL可以直接通過遍歷索引取得數據,而無需回表,這減少了很多的隨機io操作。減少io操作,特別的隨機io其實是dba主要的優化策略。所以,在真正的實際應用中,覆蓋索引是主要的提升性能的優化手段之一。
效率高。索引列越多,通過索引篩選出的數據越少。有1000W條數據的表,有如下sql:select from table where col1=1 and col2=2 and col3=3,假設假設每個條件可以篩選出10%的數據,如果只有單值索引,那么通過該索引能篩選出1000W10%=100w條數據,然后再回表從100w條數據中找到符合col2=2 and col3= 3的數據,然后再排序,再分頁;如果是聯合索引,通過索引篩選出1000w10% 10% *10%=1w,效率提升可想而知!
新聞熱點
疑難解答