首先,童家旺介紹了他認為的什么是優(yōu)化:第一、做任何事情最快的方法就是什么也不做。
▲支付寶資深數(shù)據(jù)庫架構(gòu)師童家旺
第二、不訪問不必要的數(shù)據(jù):使用B*Tree/hash等方法定位必要的數(shù)據(jù)。使用column Store或分表的方式將數(shù)據(jù)分開存儲。使用Bloom filter算法排除空值查詢。
第三、合理的利用硬件來提升訪問效率:使用緩存消除對數(shù)據(jù)的重復(fù)訪問。使用批量處理來減少磁盤的Seek操作。使用批量處理來減少網(wǎng)絡(luò)的Round Trip。使用SSD來提升磁盤訪問效率。
響應(yīng)時間和吞吐量之間的關(guān)系
1、性能。衡量完成特定任務(wù)的速度或效率。
2、響應(yīng)時間。衡量系統(tǒng)與用戶交互式多久能夠發(fā)出響應(yīng)。
3、吞吐量。衡量系統(tǒng)在單位時間里可以完成的任務(wù)量。
▲反應(yīng)時間
▲傳統(tǒng)磁盤的訪問特性
B*Tree優(yōu)化數(shù)據(jù)訪問介紹
▲B*Tree優(yōu)化數(shù)據(jù)訪問
B*Tree優(yōu)化數(shù)據(jù)訪問模擬場景
▲B*Tree優(yōu)化數(shù)據(jù)訪問模擬場景
童家旺通過阿里巴巴的真實應(yīng)用場景介紹了如何用分表存儲來提高性能。
一、場景介紹:
1、表VeryBigTable含有30個列
2、表的記錄數(shù)為50,000,000條
3、平均每個用戶為300條左右
4、其中有2個列屬于詳細描述字段,平均長度為2k
5、其它的列的總長度平均為250個字節(jié)
6、此表上的查詢有兩種模式
7、列出表中的主要信息(每次20條,不包含詳細信息,90%的查詢)
8、查看記錄的詳細信息(10%的查詢)
9、保存與Oracle數(shù)據(jù)庫,默認block_size(8k)
二、要求:
1、對此業(yè)務(wù)進行優(yōu)化
2、分析數(shù)據(jù),說服開發(fā)部門實施此優(yōu)化
三、性能分析
1、每塊記錄數(shù)
8192 * 0.80(1) / 250 = 25.5 (主表)
8192 * 0.80 / 2000 = 3.27(詳情表)
8192 * 0.80 / ( 2000 + 250 ) = 2.91
2、訪問的邏輯IO(內(nèi)存塊訪問)
List的查詢代價
改進后=( 300/25.5 ) * y + 4 + x = 4 + x + 11.8y = 4(2) + 7(3) + 11.8 * 1.5(4) = 28.7
改進前=( 300/2.91 ) * y + 4 + x = 4 + x + 103.y = 4 + 7 + 103 * 1.5 = 165.5
3、訪問涉及到的物理讀(磁盤塊訪問)
List的查詢代價(邏輯IO * ( 1 主站蜘蛛池模板: 长治县| 龙山县| 白沙| 墨竹工卡县| 平顺县| 武强县| 黄大仙区| 贵德县| 永平县| 霍城县| 栾城县| 沙田区| 新干县| 仙居县| 广宗县| 嘉定区| 仪陇县| 论坛| 永和县| 上高县| 淮阳县| 嘉禾县| 西城区| 通化市| 枣强县| 兴仁县| 宁国市| 北安市| 岫岩| 桃源县| 托克托县| 华蓥市| 闸北区| 琼中| 武义县| 西充县| 丹江口市| 丘北县| 施秉县| 云霄县| 苏尼特左旗|