国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 開發(fā) > 綜合 > 正文

解剖SQLSERVER 第十六篇 OrcaMDF RawDatabase --MDF文件的瑞士軍刀(譯)

2024-07-21 02:48:54
字體:
供稿:網(wǎng)友
解剖SQLSERVER 第十六篇 OrcaMDF RawDatabase --MDF文件的瑞士軍刀(譯)解剖SQLSERVER 第十六篇 OrcaMDF RawDatabase --MDF文件的瑞士軍刀(譯)

http://imPRove.dk/orcamdf-rawdatabase-a-swiss-army-knife-for-mdf-files/

當我最初開始開發(fā)OrcaMDF的時候我只有一個目標,比市面上大部分的書要獲取MDF文件內(nèi)部的更深層次的知識

隨著時間的推移,OrcaMDF確實做到了。在我當初沒有計劃的時候,OrcaMDF 已經(jīng)可以解析系統(tǒng)表,元數(shù)據(jù),甚至DMVs。我還做了一個簡單UI,讓OrcaMDF 更加容易使用。

這很好,但是帶來的代價是軟件非常復雜。為了自動解析元數(shù)據(jù) 例如schemas, partitions, allocation units 還有其他的東西,更不要提對于堆表和索引的細節(jié)的抽象層了,抽象層需要很多代碼并且需要更多的數(shù)據(jù)庫了解。鑒于不同SQLSERVER版本之間元數(shù)據(jù)的改變,OrcaMDF 目前僅支持SQL Server 2008 R2。然而,數(shù)據(jù)結(jié)構(gòu)是相對穩(wěn)定的,元數(shù)據(jù)的存儲方式只有一點不同,使用DMVs暴露數(shù)據(jù)等等。要讓OrcaMDF 正常運行,需要元數(shù)據(jù)是完好無損的,這就導致當SQLSERVER損壞的時候OrcaMDF 也是一樣的。遇到損壞的boot page嗎?無論SQLSERVER還是 OrcaMDF 都不能解析數(shù)據(jù)庫

向RawDatabase問好我在憧憬OrcaMDF 的未來 和如何使用他才是最有用的。我能夠不斷增加新的特性進去以使SQLSERVER支持什么功能他也支持,最終使得他能100%解析MDF文件。但是意義何在?當然,這是一個很好的學習機會,不過重點是,你使用軟件讀取數(shù)據(jù),SQLSERVER能比你做得更好。所以,該如何選擇?

RawDatabase, 參照Database 類,他不會嘗試解析任何東西除非你讓他去解析。他不會自動解析schemas。他不知道系統(tǒng)表。他不知道DMVs。然而他知道SQLSERVER數(shù)據(jù)結(jié)構(gòu)和給他一個接口他可以直接讀取MDF文件。

讓RawDatabase 只解析數(shù)據(jù)結(jié)構(gòu)意味著他可以跳過損壞的系統(tǒng)表或者損壞的數(shù)據(jù)

例子這個工具還在開發(fā)的早起,不過讓我展示一下使用RawDatabase能夠做什么東西。當我運行LINQPad上的代碼,他很容易的顯示出結(jié)果,結(jié)果只是標準的.NET 對象。所有的例子都在AdventureWorks 2008R2 LT (Light Weight)數(shù)據(jù)庫上運行

獲取單個頁面很多時候,我們只需要解析單個頁面

// Get page 197 in file 1var db = new RawDatabase(@"C:/AWLT2008R2.mdf");db.GetPage(1, 197).Dump();

解析頁頭現(xiàn)在我們獲取到頁面,我們?nèi)绾伟秧擃^dump出來

// Get the header of page 197 in file 1var db = new RawDatabase(@"C:/AWLT2008R2.mdf");db.GetPage(1, 197).Header.Dump();

解析行偏移陣列就像頁頭那樣,我們也可以把頁尾的行偏移陣列條目dump出來

// Get the slot array entries of page 197 in file 1var db = new RawDatabase(@"C:/AWLT2008R2.mdf");db.GetPage(1, 197).SlotArray.Dump();

解析數(shù)據(jù)記錄當獲取到行偏移條目的原始數(shù)據(jù),你通常想看一下數(shù)據(jù)行記錄的內(nèi)容。幸運的是,這也很容易做到

// Get all records on page 197 in file 1var db = new RawDatabase(@"C:/AWLT2008R2.mdf");db.GetPage(1, 197).Records.Dump();

從記錄中檢索數(shù)據(jù)一旦你得到記錄,你現(xiàn)在可以利用FixedLengthData 或者 VariableLengthOffsetValues 屬性去獲取原始的定長數(shù)據(jù)內(nèi)容和變長數(shù)據(jù)內(nèi)容。然而,你肯定只想獲取到實際的已解析的數(shù)據(jù)值。對于解析,OrcaMDF會幫你解析,你只需要為他提供schema.

// Read the record contents of the first record on page 197 of file 1var db = new RawDatabase(@"C:/AWLT2008R2.mdf");RawPrimaryRecord firstRecord = (RawPrimaryRecord)db.GetPage(1, 197).Records.First();var values = RawColumnParser.Parse(firstRecord, new IRawType[] {    RawType.Int("AddressID"),    RawType.NVarchar("AddressLine1"),    RawType.NVarchar("AddressLine2"),    RawType.NVarchar("City"),    RawType.NVarchar("StateProvince"),    RawType.NVarchar("CountryRegion"),    RawType.NVarchar("PostalCode"),    RawType.UniqueIdentifier("rowguid"),    RawType.DateTime("ModifiedDate")});    values.Dump();

RawColumnParser.Parse方法做的事情是 跟他一個schema,他幫你自動將raw bytes轉(zhuǎn)換為Dictionary<string, object>,key就是從schema 那里獲取到的列名,

而value就是數(shù)據(jù)列的實際值,例如int,short,guid,string等等。讓你的用戶給定schema, OrcaMDF 可以跳過大量的依賴的元數(shù)據(jù)進行解析,因此可以忽略可能的元數(shù)據(jù)錯誤帶來的數(shù)據(jù)讀取失敗。

由于頁頭已經(jīng)給出了 NextPageID 和 PreviousPageID屬性 ,這能夠讓軟件簡單的遍歷鏈表中的所有頁面,并解析這些頁面里面的數(shù)據(jù) --他基本上是根據(jù)給定的allocation unit來進行掃描

過濾頁面除非檢索一個特定的頁面,RawDatabase 也有一個頁面屬性能夠枚舉數(shù)據(jù)庫中的所有頁面。使用這個屬性,舉個例子,獲取數(shù)據(jù)庫中所有的IAM頁面的列表

// Get a list of all IAM pages in the databasevar db = new RawDatabase(@"C:/AWLT2008R2.mdf");db.Pages    .Where(x => x.Header.Type == PageType.IAM)    .Dump();

并且由于這是使用LINQ技術(shù),這很容易去設(shè)計你想要的屬性。舉個例子,你可以獲取所有的 index pages 和他們的 slot counts 就像這樣:

// Get all index pages and their slot countsvar db = new RawDatabase(@"C:/AWLT2008R2.mdf");db.Pages    .Where(x => x.Header.Type == PageType.Index)    .Select(x => new {        x.PageID,        x.Header.SlotCnt    }).Dump();

或者假設(shè)你想獲得如下條件的頁面1、頁面里面至少有一條記錄2、free space空間至少有7000 bytes

下面是page id, free count, record count 和 平均記錄大小的輸出

var db = new RawDatabase(@"C:/AWLT2008R2.mdf");db.Pages    .Where(x => x.Header.FreeCnt > 7000)    .Where(x => x.Header.SlotCnt >= 1)    .Where(x => x.Header.Type == PageType.Data)    .Select(x => new {        x.PageID,        x.Header.FreeCnt,        RecordCount = x.Records.Count(),        RecordSize = (8096 - x.Header.FreeCnt) / x.Records.Count()    }).Dump();

最后一個例子,,假設(shè)你只有一個MDF文件并且你已經(jīng)忘記了有哪些對象存儲在MDF文件里面。不要緊,我們只需要查詢系統(tǒng)表sysschobjs !sysschobjs 系統(tǒng)表包含了所有對象的數(shù)據(jù)并且幸運的是,他的object ID 是 34。利用這些信息,我們可以把所有屬于object ID 34的數(shù)據(jù)頁面過濾出來,并且從這些頁面里讀取記錄并只需要解析這個表的前兩列(你可以定義一個分部schema, 只要你在最后忽略列)

最后我們只需要把名稱dump出來(當然我們可以把表里的所有列都查詢出來,如果我們想的話)

SELECT * FROM sys.sysschobjs 

var db = new RawDatabase(@"C:/AWLT2008R2.mdf");var records = db.Pages    .Where(x => x.Header.ObjectID == 34 && x.Header.Type == PageType.Data)    .SelectMany(x => x.Records);    var rows = records.Select(x => RawColumnParser.Parse((RawPrimaryRecord)x, new IRawType[] {    RawType.Int("id"),    RawType.NVarchar("name")}));rows.Select(x => x["name"]).Dump();

兼容性可以看到 RawDatabase并不依賴于元數(shù)據(jù),這很容易兼容多個版本的SQLSERVER。因此,我很高興的宣布:RawDatabase 完全兼容SQL Server 2005, 2008, 2008R2 , 2012. 這也有可能兼容2014,不過我還未進行測試。說到測試,所有的單元測試都是自動運行的在測試期間使用AdventureWorksLT for 2005, 2008, 2008R2 and 2012 。現(xiàn)在有一些測試demo來讓OrcaMDF RawDatabase去解析AdventureWorks LT 數(shù)據(jù)庫里面每個表的每條記錄

數(shù)據(jù)損壞其中一個有趣的使用RawDatabase 的方法是用來附加損壞的數(shù)據(jù)庫。你可以檢索特定object id的所有頁面然后硬解析每個頁面無論他們是否是可讀的。如果元數(shù)據(jù)損壞,你可以忽略他,你手工提供schema (輸入表的每個列的列名)并且只需要沿著頁面鏈表或者解析IAM頁面去讀取堆表里面的數(shù)據(jù)。接下來的幾個星期我將會 寫一些關(guān)于OrcaMDF RawDatabase 的使用場景的博客,其中包括數(shù)據(jù)損壞

源代碼和反饋我非常興奮因為最新的RawDatabase 已經(jīng)添加到OrcaMDF 里面并且我希望不單只只有我一個見證他的威力。如果你也想試一試,或者有任何想法,建議或者其他反饋,我都很樂意接受。

如果你想試用,在GitHub上簽出OrcaMDF項目。一旦這個工具做得比較完美了,我會把他放上去NuGet 。就好像OrcaMDF一樣,在GPL v3 licensed 下發(fā)布

第十六篇完


發(fā)表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發(fā)表
主站蜘蛛池模板: 滨州市| 乐陵市| 新邵县| 长泰县| 定远县| 阿拉尔市| 吉林省| 白水县| 三门峡市| 桃园县| 甘孜| 永胜县| 射洪县| 刚察县| 罗江县| 贵德县| 辉县市| 新绛县| 南华县| 仁化县| 葫芦岛市| 荆门市| 梓潼县| 延长县| 乐东| 射阳县| 金堂县| 清涧县| 拉萨市| 昌图县| 嘉善县| 如皋市| 勃利县| 崇礼县| 宣化县| 钟山县| 南涧| 当涂县| 聂荣县| 洛扎县| 瑞丽市|