數(shù)據(jù)庫(kù)的水平劃分和垂直劃分很早以前就接觸了,只是沒(méi)有實(shí)踐,沒(méi)有什么體會(huì),只有最近兩年才有接觸,今天也和大家聊聊。
垂直劃分
按照功能劃分,把數(shù)據(jù)分別放到不同的數(shù)據(jù)庫(kù)和服務(wù)器。
當(dāng)一個(gè)網(wǎng)站開(kāi)始剛剛創(chuàng)建時(shí),可能只是考慮一天只有幾十或者幾百個(gè)人訪問(wèn),數(shù)據(jù)庫(kù)可能就個(gè)db,所有表都放一起,一臺(tái)普通的服務(wù)器可能就夠了,而且開(kāi)發(fā)人員也非常高興,而且信心十足,因?yàn)樗械谋矶荚谝粋€(gè)庫(kù)中,這樣查詢語(yǔ)句就可以隨便關(guān)聯(lián)了,多美的一件事情。但是隨著訪問(wèn)壓力的增加,讀寫操作不斷增加,數(shù)據(jù)庫(kù)的壓力絕對(duì)越來(lái)越大,可能接近極限,這時(shí)可能人們想到增加從服務(wù)器,做什么集群之類的,可是問(wèn)題又來(lái)了,數(shù)據(jù)量也快速增長(zhǎng)。
這時(shí)可以考慮對(duì)讀寫操作進(jìn)行分離,按照業(yè)務(wù)把不同的數(shù)據(jù)放到不同的庫(kù)中。其實(shí)在一個(gè)大型而且臃腫的數(shù)據(jù)庫(kù)中表和表之間的數(shù)據(jù)很多是沒(méi)有關(guān)系的,或者更加不需要(join)操作,理論上就應(yīng)該把他們分別放到不同的服務(wù)器。例如用戶的收藏夾的數(shù)據(jù)和博客的數(shù)據(jù)庫(kù)就可以放到兩個(gè)獨(dú)立的服務(wù)器。這個(gè)就叫垂直劃分(其實(shí)叫什么不重要)。

當(dāng)博客或者收藏夾的數(shù)據(jù)不斷增加后,應(yīng)該怎么辦,這樣就引出了另外一個(gè)做法,叫水平劃分。
水平劃分
則把一個(gè)表的數(shù)據(jù)劃分到不同的數(shù)據(jù)庫(kù),兩個(gè)數(shù)據(jù)庫(kù)的表結(jié)構(gòu)一樣。怎么劃分,應(yīng)該根據(jù)一定的規(guī)則,可以根據(jù)數(shù)據(jù)的產(chǎn)生者來(lái)做引導(dǎo),上面的數(shù)據(jù)是由人產(chǎn)生的,可以根據(jù)人的id來(lái)劃分?jǐn)?shù)據(jù)庫(kù)。然后再根據(jù)一定的規(guī)則,先獲知數(shù)據(jù)在哪個(gè)數(shù)據(jù)庫(kù)。
其實(shí)很多大型網(wǎng)站都經(jīng)歷了數(shù)據(jù)庫(kù)垂直劃分和水平的劃分的階段。其實(shí)這個(gè)可以根據(jù)經(jīng)驗(yàn)來(lái)確定,不一定由某些硬性的規(guī)則。
以剛才的博客為例,數(shù)據(jù)可以根據(jù)userid的奇偶來(lái)確定數(shù)據(jù)的劃分。把id為基數(shù)的放到A庫(kù),為偶數(shù)的放B庫(kù)。
這樣通過(guò)userId就可以知道用戶的博客的數(shù)據(jù)在哪個(gè)數(shù)據(jù)庫(kù)。其實(shí)可以根據(jù)userId%10來(lái)處理。還可以根據(jù)著名的HASH算法來(lái)處理。
當(dāng)初看手機(jī)之家的架構(gòu)是發(fā)現(xiàn)他們是:
水平切分:對(duì)數(shù)據(jù)進(jìn)行水平分割。
a.最好分到同一個(gè)數(shù)據(jù)庫(kù)。
b.一種已經(jīng)證明是切實(shí)可行的方案:主表+輔表。
c.有3種類型:主表不打散、主表打散無(wú)輔表、主表打散有輔表。
d.但對(duì)程序員來(lái)說(shuō),TA看到的只是一張表,不妨稱之為虛表(邏輯表)? ,這張?zhí)摫韺?shí)際上可能是由N張實(shí)表(物理表)組成的。
哈哈,我還是喜歡把數(shù)據(jù)分到不同的數(shù)據(jù)庫(kù),這個(gè)可以按照業(yè)務(wù)來(lái)和環(huán)境來(lái)定吧。
在說(shuō)句題外話,如果是大型數(shù)據(jù)庫(kù),還可以做讀寫分離等。
新聞熱點(diǎn)
疑難解答
圖片精選
網(wǎng)友關(guān)注