使用其他的服務器,以避免某些站點負載過重。
物化視圖還提供了按子集進行復制,這樣各站點就可只復制自己需要的數據,也能減輕網絡的傳輸量。
數據復制的實現方法
在具體的實現之前,首先要做好設計與規劃。這就需要細致分析具體的業務情況,設計出一套能夠滿足業務需要的方案。通常在設計過程中,需要確定出要建立的數據庫站點,各站點的類型,需要復制的數據對象,以及同步方式、沖突解決方案等內容。
在設計完成之后,就可具體來實現數據復制,實現主要包括以下幾步:
(1)創建復制站點
(2)創建組對象
(3)配置沖突解決方案
下面我們舉一個例子來說明各步具體需要完成的工作。在這個例子中我們采用多主控站點復制方式,設有兩個主控站點和兩個共享數據表。兩個主控站點分別為:處理站點(cl.world)和解釋站點(js.wo rld);兩個數據表為測區( survey)和測線( line)。
step1 創建復制站點
(1)首先以system身份登陸主站點數據庫cl.worldconnect system/[email protected]
(2)創建用戶—復制管理員,并為該用戶授權復制管理員負責復制站點的創建和管理,每個復制站點都必須創建復制管理員:
create user repadmin identified by repadmin;
begin
dbms_repcat_admin.grant_admin_any_schema (username => ’repadmin’);
end;
(3)為本站點指定傳播者
傳播者負責將本地最新更新的數據傳播到其他站點上:
begin
dbms_defer_sys.register_propagator (username => ’repadmin’);
end;
(4)為本站點指定接收者
接收者負責接收其他站點上的傳播者傳送過來的數據:
begin
dbms_repcat_admin.register_user_repgroup (
username => ’repadmin’,
privilege_type => ’receiver’,
list_of_gnames => null);
end;
(5)確定清除時間
為了使傳送過來事務隊列不致過大,需要將成功加載的事務從事物隊列里清除掉,這里設定每小時清除一次。
connect repadmin/[email protected]
begin
dbms_defer_sys.schedule_purge (
next_date => sysdate,
interval => ’sysdate + 1/24’,
delay_seconds => 0);
end;
在建立好站點cl.world后,以同樣的方法創建站點js. world。
(6)創建各主控站點之間的調度鏈接
創建各主控站點之間的調度鏈接需要先在各主控站點間建立數據庫鏈接,之后為每個數據庫鏈接定義調度時間。
首先,在處理站點上建立與解釋站點的數據庫鏈接,這里需要先建立一個公用數據庫鏈接,供其他私有數據庫鏈接來使用。
connect system/[email protected]
create public database link js.world using ’js.world’;
connect repadmin/[email protected]
create database link js.world connect to repadmin
identified by repadmin;
同樣,在解釋站點上建立與處理站點的數據庫鏈接
connect system/[email protected]
create public database link cl.world using ’cl.world’;
connect repadmin/[email protected]
create database link cl.world connect to repadmin
identified by repadmin;
調度鏈接確定本站點上的事務向其他站點發送的頻度,下面的代碼為10分鐘一次:
connect repadmin/[email protected]
begin
dbms_defer_sys.schedule_push (
destination => ’js.world’,
interval => ’sysdate + (1/144)’,
next_date => sysdate,
parallelism => 1,
execution_seconds => 1500,
delay_seconds => 1200);
end;
在解釋站點上做相同的工作step2 創建主控組在復制環境中,oracle用組來管理復制對象。通過將相關的復制對象放在一個組里,從而方便對大量數據對象的管理。
這里我們假設用戶模式integr ation 在處理站點和解釋站點都已存在,而且表測區(survey )和測線(line)也已經創建。
(1)創建主控組對象
connect repadmin/[email protected]
begin
dbms_repcat.create_master_repgroup (
gname => ’inte_repg’);
end;
(2)向主控組中添加數據對象,將測區表survey加入到組inte_repg中
begin
dbms_repcat.create_master_repobject (
gname => ’inte_repg’,
type => ’table’,
oname => ’survey’,
sname => ’integration’,
use_existing_object => true,
copy_rows => false);
end;
以同樣的方法將測線表line 加入到組inte_repg中
(3)在主控組中添加其他參與復制的站點,數據庫之間的同步方式在此指定
begin
dbms_repcat.add_master_database (
gname => ’inte_repg’,
master => ’js.world’,
use_existing_objects => true,
copy_rows => false,
propagation_mode => ’asynchronous’);
end;
(4)如果可能出現沖突,則需要配置沖突解決方案。沖突解決方案將在后面介紹。
(5)為每個對象生成復制支持
begin
dbms_repcat.generate_replication_support (
sname => ’integration’,
oname => ’survey’,
type => ’table’,
min_communication => true);
end;
測線表line也一樣
(6)重新開始復制
begin
dbms_repcat.resume_master_activity (
gname => ’inte_repg’);
end;
以同樣的方式設置解釋站點。設置成功后,數據復制過程就宣告完畢,庫中的數據就可進行復制。
數據復制中沖突的解決方案
在復制環境中,盡管在數據庫和應用程序設計過程中,會盡量避免各站點間沖突的發生,但完全避免沖突的可能性還是比較小的,那么一旦沖突發生,就需要一個按照具體業務規則的沖突解決機制,來使得各站點的數據保持一致。
首先需要分析哪些對象容易出現沖突。通常來說,靜態的數據變化少,沖突出現的可能性也小;而有些數據變化非常大,沖突出現的可能性也大。確定了沖突易發的對象后,需要確定怎樣解決沖突,比如在各站點之間建立優先次序,在數據不一致時,以某個站點上的為
準;或以某個站點上最新的修改為準。
oracle提供了多中沖突解決方案,具體包括:針對更新沖突的方案、針對唯一性沖突的方案、針對刪除沖突的方案。除了這些方案以外,用戶還可以自定義沖突解決方法。每種方案都有自己的適用情況,那么我們需要根據具體的業務來選擇合適的沖突解決方案。
結束語
本文詳細介紹了分布式系統oracle中的數據復制技術,在具體應用中,還有許多比較復雜的問題需要解決,比如主控組中如果包含循環依賴的表或自相關的表時如何處理;如何利用模版機制來創建物化視圖站點;如何對數據復制環境進行管理與維護。這些問題需要在實際
應用中逐步探索,深入研究。
新聞熱點
疑難解答