前段時(shí)間聽同事分享,偶爾講起Oracle數(shù)據(jù)庫(kù)的位圖索引,頓時(shí)大感興趣。說(shuō)來(lái)慚愧,在這之前對(duì)位圖索引一無(wú)所知,因此趁此機(jī)會(huì)寫篇博文介紹下位圖索引。
有張表名為table的表,由三列組成,分別是姓名、性別和婚姻狀況,其中性別只有男和女兩項(xiàng),婚姻狀況由已婚、未婚、離婚這三項(xiàng),該表共有100w個(gè)記錄。現(xiàn)在有這樣的查詢: select * from table where Gender=‘男’ and Marital=“未婚”;
姓名(Name) | 性別(Gender) | 婚姻狀況(Marital) |
張三 | 男 | 已婚 |
李四 | 女 | 已婚 |
王五 | 男 | 未婚 |
趙六 | 女 | 離婚 |
孫七 | 女 | 未婚 |
... | ... | ... |
1)不使用索引
不使用索引時(shí),數(shù)據(jù)庫(kù)只能一行行掃描所有記錄,然后判斷該記錄是否滿足查詢條件。
2)B樹索引
對(duì)于性別,可取值的范圍只有'男','女',并且男和女可能各站該表的50%的數(shù)據(jù),這時(shí)添加B樹索引還是需要取出一半的數(shù)據(jù), 因此完全沒有必要。相反,如果某個(gè)字段的取值范圍很廣,幾乎沒有重復(fù),比如身份證號(hào),此時(shí)使用B樹索引較為合適。事實(shí)上,當(dāng)取出的行數(shù)據(jù)占用表中大部分的數(shù)據(jù)時(shí),即使添加了B樹索引,數(shù)據(jù)庫(kù)如oracle、MySQL也不會(huì)使用B樹索引,很有可能還是一行行全部掃描。
如果用戶查詢的列的基數(shù)非常的小, 即只有的幾個(gè)固定值,如性別、婚姻狀況、行政區(qū)等等。要為這些基數(shù)值比較小的列建索引,就需要建立位圖索引。
對(duì)于性別這個(gè)列,位圖索引形成兩個(gè)向量,男向量為10100...,向量的每一位表示該行是否是男,如果是則位1,否為0,同理,女向量位01011。
RowId | 1 | 2 | 3 | 4 | 5 | ... |
男 | 1 | 0 | 1 | 0 | 0 |
|
女 | 0 | 1 | 0 | 1 | 1 |
|
對(duì)于婚姻狀況這一列,位圖索引生成三個(gè)向量,已婚為11000...,未婚為00100...,離婚為00010...。
RowId | 1 | 2 | 3 | 4 | 5 | ... |
已婚 | 1 | 1 | 0 | 0 | 0 |
|
未婚 | 0 | 0 | 1 | 0 | 1 |
|
離婚 | 0 | 0 | 0 | 1 | 0 |
|
當(dāng)我們使用查詢語(yǔ)句“select * from table where Gender=‘男’ and Marital=“未婚”;”的時(shí)候 首先取出男向量10100...,然后取出未婚向量00100...,將兩個(gè)向量做and操作,這時(shí)生成新向量00100...,可以發(fā)現(xiàn)第三位為1,表示該表的第三行數(shù)據(jù)就是我們需要查詢的結(jié)果。
RowId | 1 | 2 | 3 | 4 | 5 |
男 | 1 | 0 | 1 | 0 | 0 |
and |
|
|
|
|
|
未婚 | 0 | 0 | 1 | 0 | 1 |
結(jié)果 | 0 | 0 | 1 | 0 | 0 |
上面講了,位圖索引適合只有幾個(gè)固定值的列,如性別、婚姻狀況、行政區(qū)等等,而身份證號(hào)這種類型不適合用位圖索引。
此外,位圖索引適合靜態(tài)數(shù)據(jù),而不適合索引頻繁更新的列。舉個(gè)例子,有這樣一個(gè)字段busy,記錄各個(gè)機(jī)器的繁忙與否,當(dāng)機(jī)器忙碌時(shí),busy為1,當(dāng)機(jī)器不忙碌時(shí),busy為0。
這個(gè)時(shí)候有人會(huì)說(shuō)使用位圖索引,因?yàn)閎usy只有兩個(gè)值。好,我們使用位圖索引索引busy字段!假設(shè)用戶A使用update更新某個(gè)機(jī)器的busy值,比如update table set table.busy=1 where rowid=100;,但還沒有commit,而用戶B也使用update更新另一個(gè)機(jī)器的busy值,update table set table.busy=1 where rowid=12; 這個(gè)時(shí)候用戶B怎么也更新不了,需要等待用戶A commit。
原因:用戶A更新了某個(gè)機(jī)器的busy值為1,會(huì)導(dǎo)致所有busy為1的機(jī)器的位圖向量發(fā)生改變,因此數(shù)據(jù)庫(kù)會(huì)將busy=1的所有行鎖定,只有commit之后才解鎖。
轉(zhuǎn)載請(qǐng)標(biāo)明源地址:http://www.cnblogs.com/LBSer新聞熱點(diǎn)
疑難解答
圖片精選