十二、分布式數(shù)據(jù)庫
1.分布式數(shù)據(jù)庫的分類
分布式數(shù)據(jù)庫,是根據(jù)它的管理系統(tǒng)(Distributed DBMS-DDBMS)進(jìn)行分類的。對DDBMS可以從四個(gè)不同角度來分類:
(1)從構(gòu)成的方式,可分為同構(gòu)型和異構(gòu)型兩類所謂同構(gòu)型,是指所有節(jié)點(diǎn)的局部DBMS都支持同一數(shù)據(jù)模式和數(shù)據(jù)語言。為使每個(gè)節(jié)點(diǎn)都掌握彼此的數(shù)據(jù)情況,需要增加網(wǎng)絡(luò)數(shù)據(jù)庫管理系統(tǒng)(NDBMS),各節(jié)點(diǎn)之間通過通信網(wǎng)絡(luò)形成統(tǒng)一的整體。同構(gòu)型的DDBMS對于并發(fā)控制、冗余數(shù)據(jù)的一致性等問題容易處理,但建庫的代價(jià)比較大。所謂異構(gòu)型系統(tǒng),是指在分布環(huán)境中各節(jié)點(diǎn)上的數(shù)據(jù)模型和數(shù)據(jù)語言都可能不同。異構(gòu)比同構(gòu)型系統(tǒng)實(shí)現(xiàn)起來要困難一些,為了在兩個(gè)節(jié)點(diǎn)上的局部DBMS之間進(jìn)行信息交換,就要對數(shù)據(jù)模式和數(shù)據(jù)語言進(jìn)行轉(zhuǎn)換和映射工作。
(2)按控制方式,可以分為集中式與分布式所謂集中控制的DDBM指所有事務(wù)都由一臺叫做中心計(jì)算機(jī)的節(jié)點(diǎn)進(jìn)行管理。分布控制的DDBMS,是指每個(gè)節(jié)點(diǎn)都保持DDBMS的一個(gè)副本來監(jiān)督和管理各節(jié)點(diǎn)及系統(tǒng)事務(wù),它將網(wǎng)絡(luò)目錄作為用戶數(shù)據(jù)庫存放于局部DB之中。
(3)從數(shù)據(jù)分布的角度,DDBMS又可分為分割式、部分重復(fù)式和完全重復(fù)式所謂分割式,是指每個(gè)節(jié)點(diǎn)只存儲DDB數(shù)據(jù)實(shí)體的部分子集,各節(jié)點(diǎn)的副本互不重疊。部分重復(fù)式,是指每個(gè)節(jié)點(diǎn)都存儲DDB數(shù)據(jù)實(shí)體的任意子集。完全重復(fù)式,是指每個(gè)節(jié)點(diǎn)都存儲整個(gè)DDB數(shù)據(jù)實(shí)體的副本。也有文獻(xiàn)把完全重復(fù)式稱為復(fù)制式。(4)從用戶的角度,DDBM可分為總體型和多重型。
2.分布式數(shù)據(jù)庫與單一數(shù)據(jù)庫的比較
(1)集中控制 在一個(gè)企業(yè)或單位范圍內(nèi)的信息資源上,對信息提供集中式控制的可能性,被認(rèn)為是采用數(shù)據(jù)庫技術(shù)的最大動力之一,因?yàn)榧惺綌?shù)據(jù)庫是根據(jù)信息系統(tǒng)的演變和集中處理信息的需求開發(fā)出來的。
(2)數(shù)據(jù)獨(dú)立性 數(shù)據(jù)獨(dú)立性也曾經(jīng)被認(rèn)為是采用數(shù)據(jù)庫方法的主要?jiǎng)恿χ弧?shí)際上,數(shù)據(jù)獨(dú)立性意味著數(shù)據(jù)的實(shí)際結(jié)構(gòu)對應(yīng)用程序來講是透明的,應(yīng)用程序員只需要利用數(shù)據(jù)邏輯結(jié)構(gòu),即所謂概念模式來編寫程序。數(shù)據(jù)獨(dú)立性的主要優(yōu)點(diǎn)是應(yīng)用不受數(shù)據(jù)存儲的物理結(jié)構(gòu)變化的影響。在分布式數(shù)據(jù)庫中,數(shù)據(jù)的獨(dú)立性具有與傳統(tǒng)的集中式數(shù)據(jù)同等的重要性,然而,一種嶄新概念加進(jìn)了數(shù)據(jù)獨(dú)立性的一般概念之中,這就是分布式透明性。所謂分布式透明性,指的是在編寫程序時(shí)就好象數(shù)據(jù)沒有被分布一樣。這樣,無論把數(shù)據(jù)存儲到甲地或乙地,或者把數(shù)據(jù)從一個(gè)節(jié)點(diǎn)移到另一個(gè)節(jié)點(diǎn),都不會影響程序執(zhí)行的正確性和有效性,但是,必須指出,執(zhí)行速度或者效率卻受到了影響。眾所周知,通過具有不同形式的數(shù)據(jù)描述和它們之間的映射的多層體系結(jié)構(gòu),曾為傳統(tǒng)的數(shù)據(jù)庫提供了獨(dú)立性,為此目的,開發(fā)出了概念模式、存儲模式和外部模式等概念。利用類似的方法,我們可以通過采用新層次和新模式,在分布式數(shù)據(jù)庫中可獲得分布式透明性。分布式透明性是分布式數(shù)據(jù)庫系統(tǒng)的主要目標(biāo)之一。
(3)降低冗余 在傳統(tǒng)數(shù)據(jù)庫系統(tǒng)中,盡可能地降低冗余度是它的主要目標(biāo)之一。這有兩個(gè)原因:首先,通過只用一個(gè)正本,可以自動地避免同一邏輯數(shù)據(jù)中幾個(gè)副本之間的不一致性。其次,用降低冗余度來節(jié)約存儲空間。通過共享數(shù)據(jù)的方式,即通過允許幾個(gè)應(yīng)用訪問同一文件和記錄可以達(dá)到降低冗余度的目的。但是,在分布式數(shù)據(jù)庫中,把數(shù)據(jù)的冗余看成是所需要的特性。這有幾個(gè)原因:首先,如果在需要冗余的所有節(jié)點(diǎn)都復(fù)制數(shù)據(jù),則可以增加應(yīng)用的局部性。其次,可以增加分布式數(shù)據(jù)庫系統(tǒng)的有效性和可靠性。因?yàn),如果?fù)制數(shù)據(jù),則一個(gè)節(jié)點(diǎn)上的故障不會停止其它節(jié)點(diǎn)上應(yīng)用的執(zhí)行。在一般情況下,為傳統(tǒng)集中式環(huán)境所規(guī)定的克服冗余的原因,在分布式環(huán)境中仍是有效的。因此,在分布式數(shù)據(jù)庫中,對冗余度的評價(jià)要選擇一種折衷方案,不能一概而論。一般地說,復(fù)制數(shù)據(jù)項(xiàng)的方便程度是隨著應(yīng)用所執(zhí)行的檢索訪問與更新訪問的比率提高而增加。數(shù)據(jù)復(fù)制便利程度的提高,是因?yàn)榫哂幸粋(gè)項(xiàng)目多個(gè)副本,檢索可以在任一副本上進(jìn)行,而更新卻必須在所有副本上一致地進(jìn)行。
(4)有效訪問 復(fù)雜的訪問結(jié)構(gòu),如輔助索引,文件間的鏈接等,都是傳統(tǒng)數(shù)據(jù)庫所采用的重要技術(shù),對這些結(jié)構(gòu)的支持是數(shù)據(jù)庫管理系統(tǒng)DBMS極為重要的組成部分。提供復(fù)雜訪問結(jié)構(gòu)的原因,是為了提高存取數(shù)據(jù)的效率。
(5)完整性、恢復(fù)和并發(fā)控制 在數(shù)據(jù)庫理論中,盡管完整性、恢復(fù)和并發(fā)控制等所涉及的問題是不同的,但它們之間相互聯(lián)系還是很多的,一般來說,完整性、恢復(fù)和并發(fā)控制等問題的解決,在很大程度上取決于所提供的事務(wù)的結(jié)構(gòu)形式。
(6)保密性和安全性 在傳統(tǒng)數(shù)據(jù)庫中,具有集中式控制的數(shù)據(jù)庫管理員能保證只執(zhí)行那些授權(quán)的數(shù)據(jù)訪問。但應(yīng)當(dāng)指出,集中式數(shù)據(jù)庫本身比過去處理單獨(dú)文件的舊方法更難于實(shí)現(xiàn)數(shù)據(jù)的保密性和安全性。在分布式數(shù)據(jù)庫中,局部數(shù)據(jù)庫管理員面臨的一些主要問題,與傳統(tǒng)數(shù)據(jù)庫管理員面臨的問題一樣。但是,分布式數(shù)據(jù)庫的兩個(gè)獨(dú)特方面值得一提:首先,在具有極高度節(jié)點(diǎn)自主權(quán)的分布式數(shù)據(jù)庫中,局部數(shù)據(jù)的擁有者認(rèn)為比較安全,因?yàn)樗麄兡茏灾鞯貙?shí)施自己的安全措施,以履行集中式數(shù)據(jù)庫管理員的職責(zé)。其次,安全性問題,一般是分布式系統(tǒng)的固有問題,因分布式系統(tǒng)是通過通信網(wǎng)絡(luò)來實(shí)現(xiàn)分布式控制的,而通信網(wǎng)絡(luò)本身就在保護(hù)數(shù)據(jù)的安全性和保密性方面存在著弱點(diǎn)。通過網(wǎng)絡(luò)偷看、亂改別人的數(shù)據(jù)難以完全避免。
3.分布式數(shù)據(jù)庫管理系統(tǒng)(DDBMS)
在目前分析DDBMS的性能時(shí),應(yīng)該把商品化系統(tǒng)和先進(jìn)的研究樣機(jī)區(qū)分開來,但是可以預(yù)料,某些先進(jìn)的研究樣機(jī)中試驗(yàn)的特性,可能會應(yīng)用到將來的商品化系統(tǒng)中去的。本節(jié)簡要敘述分布式數(shù)據(jù)庫管理系統(tǒng)的基本性能,并就用什么樣的方法使得分布式數(shù)據(jù)庫這個(gè)新技術(shù)商品化的問題談一點(diǎn)看法。從目前看,世界上幾各已經(jīng)商品化的分布式系統(tǒng)是由集中式數(shù)據(jù)庫管理系統(tǒng)的銷售廠商開發(fā)出來的。這些分布式數(shù)據(jù)庫管理系統(tǒng),包括擴(kuò)充集中式DBMS時(shí)所附加的部件。分布式功能的擴(kuò)充是通過裝配在計(jì)算機(jī)網(wǎng)絡(luò)中不同節(jié)點(diǎn)上的DBMS之間所提供的通信和合作來實(shí)現(xiàn)的。在這種情況下建立分布式數(shù)據(jù)庫通常所必須的軟件部分是:
(1)數(shù)據(jù)庫管理部分(DB);
(2)數(shù)據(jù)通信部分(DC);
(3)數(shù)據(jù)字典(DD),它能用來表示有關(guān)網(wǎng)絡(luò)中數(shù)據(jù)分布的信息;
(4)分布式數(shù)據(jù)庫部分(DDB)。
北京 | 天津 | 上海 | 江蘇 | 山東 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
廣東 | 河北 | 湖南 | 廣西 | 河南 |
海南 | 湖北 | 四川 | 重慶 | 云南 |
貴州 | 西藏 | 新疆 | 陜西 | 山西 |
寧夏 | 甘肅 | 青海 | 遼寧 | 吉林 |
黑龍江 | 內(nèi)蒙古 |