> 第二章 NGWS Runtime 技術基礎(rainbow 翻譯) (轉自重粒子空間
2024-07-21 02:20:20
供稿:網友
<<展現c#>> 第二章 ngws runtime 技術基礎(rainbow 翻譯)
出處:http://www.informit.com/matter/ser0000001/chapter1/ch02.shtml
正文:
第二章 ngws runtime 技術基礎
既然你已經具有了c#全面的印象,我也想讓你了解ngws runtime的全貌。c#依靠由ngws提供的運行時;因此,有必要知道運行時如何工作,以及它背后所蘊含的概念。
所以,這一章分為兩部分——它們是所有的概念和使用的基礎。兩部分的內容雖然有些重疊,但它有助于加深理解正在學習的概念。
2.1 ngws runtime
ngws和ngws runtime為你提供了一種運行時環境。該運行時管理執行代碼,并提供了使編程更容易的服務。只要你的編譯器支持這種運行時,你就會從這種受管理的執行環境中得益。
你猜測c#編譯器支持ngws runtime很正確,但是不僅它支持ngws runtime,vb和c++也支持。這些為支持運行時所創建的代碼稱作"受管代碼"(managed code)。以下是你的應用程序從ngws runtime那里所得到的利益:
交叉語言集成(通過通用語言規范)
自動內存管理(垃圾收集)
交叉語言異常處理(統一展開)
增強安全(包括類型安全)
版本支持("dll地獄"終結者)
組件交互簡化模式
因ngws runtime 要提供了所有的這些好處,編譯器必須把元文件和受管代碼一起發出。元文件描述代碼中的類型,它和你的代碼存在一起(與pe類似---pe為可變位執行文件)
正如你從很多種交叉語言功能所看到的,ngws runtime主要是關于高度集成交叉多異編程語言(tight integration across multiple different programming languages)。這種支持可達到允許你從一個vb對象派生出一個c#類的程度(我后面會給出要討論的文章)。
c#程序員將會喜歡的一個功能是,他們不必擔心內存管理—也就是說不必擔心臭名昭著的內存泄漏。ngws runtime提供了內存管理,當對象和變量的生命期結束(不再被引用)時,垃圾收集器釋放它們。我真的喜歡這個功能,因為在com中的內存管理一直是我的一塊心病。
應該鼓勵配置一個管理應用程序或者組件。因為管理應用程序含有元數據文件,ngws runtime可以利用這些信息,以確保你的應用程序具有它所需的各種規定版本。所產生的明顯效果為,由于你的代碼沒有相互之間的依賴,很少可能出現中斷。
這章余下來的將分為兩部分,每一部分討論ngws runtime的各個方面,直到你的c#應用程序能執行為止。
1、中間語言(intermediate language,縮寫il)和元數據
2、即時編譯器(just-in-time compliers,簡稱jiters)
2.1.1 中間語言和元數據
由c#編譯器生成的受管代碼并不是原始代碼,但它是中間語言(il)代碼。這種il代碼自身變成了ngws runtime的受管執行進程的入口。il代碼明顯的優勢在于它是cpu無關的,這也意味著,你要用目標機器上的一個編譯器才能把il代碼轉換成原始代碼。
盡管il代碼由編譯器產生,但它并不是編譯器提供給運行時僅有的東西。編譯器同樣產生有關你代碼的元數據,它告訴運行時有關你代碼的更多的東西,例如各種類型的定義、各種類型成員的簽名以及其它數據?;旧希獢祿穷愋蛶?、注冊表內容和其它用于com的信息。盡管如此,元數據還是直接和執行代碼合并在一起,并不處在隔離的位置。
il和元數據存放于擴展了pe格式的文件中(pe格式用于.exe和.dll文件)。當這樣的一個pe文件被裝載時,運行時從文件中定位和分離出元數據和il。
在進一步說明之前,我想給你已有的il指令的簡短目錄。盡管它不是一個完整的清單,也不需要你熟記和理解,但是它列出了你所必需的、c#程序所基于的知識基礎。
算術和邏輯操作符
控制流
直接內存訪問
堆棧操作
參數和局部變量
堆棧分配
對象模式
實例類型值
臨界區
數組
分型位置
即時編譯器(jitters)
2.1.2 即時編譯器(jitters)
由c#或其它能產生受管代碼的編譯器所生成的受管代碼就是il碼。雖然il代碼被包裝在一個有效的pe文件中,但是你還是不能執行它,除非它被轉換成為受管原始代碼。這就是ngws runtime 即時編譯器(也稱作jitters)大顯身手的時候。
為什么你會對即時編譯代碼感到厭繁, 為什么不把整個il pe文件編譯成原始代碼? 答案是時間——需要把il代碼編譯成cpu規格的代碼的時間。這種編譯將更加有效率,因為一些程序段從來就沒有被執行過。例如,在我的字處理器中,郵件合并功能從來就沒有被編譯。
從技術上說,全部的處理過程如下:當一個類型被裝載時,裝載器創建一個存根(stub),并使它連接每一個類型的方法。當一個方法第一次被調用時,存根把控制交給jit。jit把il編譯為原始代碼,且把存根指針指向緩沖了的原始代碼。接著的調用將執行原始碼。在某些位置上(at some point),所有的il都被轉換成為原始代碼,而jitter處于空閑狀態。
正如我在前面提到的,jit編譯器有很多,不止一個。在windows平臺上,ngws runtime裝有3個不同的jit編譯器。
jit——這是ngws runtime默認使用的jit編譯器。它是一個后臺(back end)優化的編譯器 ,在前臺(up front)實行數據流分析,并創建了高度優化的受管原始代碼做為輸出結果。jit可以使用不嚴格的il指令集編碼,但是所需資源將十分可觀。主要的限制在于內存足跡(footprint)、結果工作集,以及實行優化所消耗的時間。
econojit—— 和主jit相比,econjit的目標是把il高速地轉換成受管原始代碼。它允許緩沖所產生的原始代碼,但是輸出碼并不象主jit生成的代碼那樣優化(代碼小)。當內存緊張時,快速代碼生成方案的優勢將蕩然無存。通過永久地拋棄無用的已jit過的代碼,你可以把更大的il程序裝入代碼緩沖區。因為jit編譯快,執行速度也仍然很快。
prejit—盡管它是基于主jit的,但操作起來更象是一個傳 統的編譯器。你安裝了ngws組件,它才能運行,才可以把il代碼編譯成受管原始代碼。當然最終的結果為,更快的裝載時間和更快的應用程序啟動時間(不需要更多的jit編譯)。
在所列出的jitters中,有兩個是運行時的jitters??墒悄阍趺礇Q定要使用哪一個jit,它如何使用內存? 有一個稱做"jit編譯管理器"的小應用程序(jitman.exe),它存放于ngws sdk安裝目錄下的bin目錄中。當執行該程序時,它把一個圖標加到系統任務條上,雙擊該圖標打開程序對話框(見圖2.1)。
圖2.1 jit編譯管理器允許你設置各種相關性能的選項
盡管它是一個小小的對話框,可是你所選擇的選項功能是相當強大的。每一個選項將在以下描述。
use econojit only 選項——當該復選框沒有選上時,ngws runtime使用默認的正常的jit編譯器。前面就曾經解釋過兩種jitter的區別。
max code pitch overhead(%)選項——該設置僅保留給econojit。它控制了jit編譯時間和執行代碼時間的百分比。如果超過了設定的域值,代碼緩沖區得到擴充,以縮短jit編譯所消耗的時間。
limit size of code cache選項——該項默認為非選。沒有選擇該項意味著緩沖區將使用它所能得到的內存。如果你想限制緩沖區大小,復選該選項,這將允許你使用max size of cache(bytes)選項。
max size of cache(bytes)選項—控制容納jit代碼的緩沖區的最大值。雖然你可以非常嚴格地限制這個值,但你還是應該小心,不能超過這個緩沖區所適合的最大值。否則該方法的jit編譯將會失敗。
optimize for size選項——告訴jit 編譯器,優化的目的是為了使代碼更小而不是能執行得更快。這個設置默認是關掉的。
enable concurrent gc[garbage collection]選 項——垃圾收集(gc)默認地運行在用戶代碼的線程中。意味gc發生時,可能會注意到回應有輕微的延遲。為防止出現該現象,打開當前gc。注意,當前gc比標準gc更慢,它僅在windows 2000上寫時(the time of writing)有效。
當用c#創建項目時,你可能使用不同的設置試驗過。當創建 ui-intensive應用程序時,你將會看到允許當前gc的最大差別。
2.2 虛擬對象系統(vos)
到目前為止,你僅看到了ngws runtime如何工作,但是并不了解它工作的技術背景以及為什么它要這樣工作。這節都是關于 ngws 虛擬對象系統的(vos)。
以下為在vos中形成聲明、使用和管理類型模型時,ngws runtime的規則。在vos背后的思想是建立一個框架,在執行代碼時不能犧牲性能,允許交叉語言集成和類型安全。
我提到的框架是運行時架構的基礎。為了幫助你更好地了解它,我將它勾出四個區域。當開發c#應用程序和組件時,理解它們很重要。
vos類型系統——提供豐富的類型系統,它打算支持全面編程語言的完全實施。
元數據——描述和引用vos類型系統所定義的類型。元數據的永久格式與編程語言無關,但是,元數據拿自己當作一種互換機制(nterchange mechanism)來使用,這種互換是在在工具和ngws的虛擬執行系統之間。
通用語言規范(cls)——cls定義了vos中類型的子集,也定義了常規的用法。如果一個類庫遵守cls的規則,它確保類庫可以在其它所有能實現cls的編程語言上使用。
虛擬執行系統(ves)——這是vos實時的實現。ves負責裝入和執行為ngws運得時編寫的程序。
這四個部分一起組成了ngws runtime架構。每一部分在下面小節中描述。
2.2.1 vos類型系統
vos類型系統提供豐富的類型系統,它打算支持多種編程語言的完全實施。所以,vos必須都支持面向對象的語言和過程編程語言。
現在,存在著很多種近似但有點不兼容的類型。就拿整型當例子,在vb中,它是16位長,而在c++中,它是32位。還有更多的例子,特別是用在日期和時間以及數據庫方面的數據類型。這種不兼容使應用程序的創建和維護不必要地復雜化,尤其當程序使用了多種編程語言時。
另一個問題是,因為編程語言之間存在著一些差別,你不能在一種語言中重用另一種語言創建的類型。(com用二進制標準接口部分地解決了這個問題)。 當今代碼重用肯定是有限的。
發布應用程序的最大障礙是各種編程語言的對象模型不統一。幾乎每一方面都存在著差異:事件、屬性、永久保存(persistence)等等。
vos這里將改變 這種現象 。vos定義了描述值的類型,并規定了類型的所有值所必須支持的一條合約。由于前面提到的支持面向對象和過程編程語言,就存在著兩種值和對象。
對于值,類型存儲于表述(representation)中,同樣操作也在其中實行。對象更強大因為它顯式地存于表述中。每一個對象都有一個區別于其它對象的識別號。支持不同的vos類型在第四章 "c#類型"中提出。
2.2.2元數據
盡管元數據用于描述和引用由vos類型系統定義的類型,但它還不能鎖定到這個單個目標。當你寫一個程序時,通過利用類型聲明,你所聲明的類型(假定它們是數值類型或引用類型)被介紹給ngws runtime類型系統。類型聲明在存于pe可執行文件內部的元數據中得到描述。
基本上,元數據用于各項任務:用于表示ngws runtime用途的信息,如定位和裝載類、 內存中這些類的事例、解決調用 、翻譯il為原始碼、加強安全并設置運行時上下文邊界。
你不必關心元數據的生成。元數據是由c#的"代碼轉il編譯器"(code-to-il compiler,不是jit編譯器)生成的。代碼轉il編譯器發送二進制元數據信息給pe文件,是以標準的方式發送的,不象c++編譯器那樣,為出口函數創建它們自己的修飾名字。
你從元數據和可執行代碼并存所獲得的主要優勢為,有關類型的信息同類型自身固定在一起,不會遍布很多地方。同樣有助于解決存在于com中的版本問題。進一步地,你可以在相同的上下文中使用不同的版本庫,因為庫不僅被注冊表引用,也被包含在可執行代碼中的元數據引用。
2.2.3通用語言規范
通用語言規范(cls)并不是虛擬對象系統(vos)真正的一部分,它是特殊的。cls定義了vos中的一個類型子集,也定義了必須符合cls的常規用法。
那么,對此有什么迷惑呢?如果一個類庫遵守cls規則,其它編程語言同樣也遵守cls規則,那么其它編程語言的客戶也可以使用類庫。cls是關于語言的交互可操作性(interoperability)。因此,常規用法必須僅遵循外部可訪問項目 (externally visible items)如方法、屬性和事件等等。
我所描述的優點是你可以做以下工作。用c#寫一個組件,在vb中派生它,因加在vb中的功能是如此之強大,在c#中再次從vb類派生它。只要所有的外部可訪問項遵守cls規則,這樣是可行的。
我在這本書中出示的代碼不關心cls協定。但在構建你的類庫時要注意到cls協定。我提供了表2.1,用以給類型和外部可訪問項定義協定規則。
這個清單不完整。它僅包含一些很重要的項目。我不指出出現在本書中每一種類型的cls協定,所以有個好主意:當你尋找cls協定時,至少應該用瀏覽該表,以了解哪種功能有效。不要擔心你不熟悉這章表中的每一個含義,在這本書中你會學到它們。
表2.1 通能語言規范中的類型和功能
bool
char
byte
short
int
long
float
double
string
object(所有對象之母)
arrays(數組)
數組的維數必須是已知的(>=1),而且最小下標數必須為0。
要素類型必須是一個cls類型。
類型(types)
可以被抽象或隱藏。
零或更多的接口可以被實現。不同的接口允許擁有具有相同名字和簽名的方法。
一個類型可以準確地從一個類型派生。允許成員被覆蓋和被隱藏。
可以有零或更多的成員,它們是字段(fields)、方法、事件或者類型。
類型可以擁有零或更多個構造函數。
一種類型的可訪問性可以是公共的或者對ngws組件來說是局部的;但是,僅公共成員可以認為是類型接口的一部分。
所有的值型必須從系統值型繼承。異常是一個枚舉——它必須從系統枚舉(system enum)繼承。
類型成員
類型成員允許隱藏或者覆蓋另一種類型中的其它成員。
參數和返回值的類型都必須是 cls 協定 類型。
構造函數、方法和屬性可以被重載。
一個類型可以有抽象成員,但僅當類型不被封裝時。
方法
一種方法可以是靜態、虛擬或者實例。
虛擬和實例方法可以是抽象的,或者是一個實現。靜態方法必須總擁有一個實現。
虛擬方法可能是最后的(或者不是)。
字段(fields)
可以是靜態或者是非靜態。
靜態字段可以被描述或只初始化。
屬性
當獲取和設置方法而不是使用屬性語法時,屬性可以公開。
獲取的返回類型和設置方法的第一個參數必須是相同的cls類型——屬性的類型。
屬性名字必須不同,不同的屬性類型用于區分是不充分的。
由于使用方法實現屬性訪問,如果 propertyname 是同一個類中定義的一個屬性,你不能實現命名為 get_propertyname 和 set_propertyname 的方法。
屬性可以被索引。
屬性訪問必須遵循這種命名格式:get_proname,set_propname。
枚舉(enumerations)
強調類型必須是byte、short、int 或long。
每一個成員是一個枚舉類型的靜態描述字段。
一個枚舉不能實現任何接口。
你允許給多字段設定相同的值。
一個枚舉必須繼承系統枚舉(隱含在c#中)
異常
可以被引發和被捕獲。
自定義異常必須繼承系統異常。
接口
可需要實現其它接口。
一個接口可以定義屬性、事件和虛擬方法。實現取決于派生類。
事件
增加和取消方法必須是都提供或者都沒有 ,每一種方法采用一個參數,它是一個從系統代表元(system delegate)派生下來的類。
自定義屬性
可以僅使用下更類型:type(類型),char, char, bool, byte, short, int, long, float, double, enum (一種cls 類型), and object.
代表元(delegates)
可以被創建和被激活
標識符(identifiers)
一個標識符的第一個字母必須來自一限制集。
通過大小寫在單一范圍內,不可能唯一地區別兩個或更多個標識符(大小寫不敏感)。
2.2.4虛擬執行系統(ves)
虛擬執行系統實現了虛擬對象系統。通過實現一個負責ngws runtime的執行引擎(execution engine,縮寫ee)創建ves。這個執行引擎執行你用c#編寫和編譯的應用程序。
下列組件為ves的一部分。
1、中間語言(il)——被設計為很容易受各種各樣的編譯器所兼容 。在該框架之外,c++、vb和c#編譯器都能夠生成il。
2、裝入受管代碼——這包括解決內存中的名字、 表層類(laying out classes ),并且創建jit編譯所必需的存根。通過執行經常性校驗,包括加強一些訪問規則,類裝載器同樣也增強了安全性。
3、用jit轉換il成原始代碼——il代碼并不是設計成為一種傳統的解釋字節代碼或樹型代碼,il轉換是真正的編譯。
4、裝入元數據、校驗類型安全和方法的完整性
5、垃圾收集(gc)和異常處理——兩者都是基于堆棧格式的服務。受管代碼允許你動態地跟蹤堆棧。要動態地識別各個堆??蚣?,jitter或其它編譯器必須提供一個代碼管理器。
6、描繪和查錯服務——兩者都取決于由源語言編譯器所生成的信息。必須發出兩個映射:一個映射從源語言結構發到指令流中的地址,一個映射從地址發到堆??蚣苤械奈恢谩.攬绦袕膇l到原始代碼的轉換時,這些映射被重新計算。
7、管理線程和上下文,還有遠程管理——ves為受管代碼提供這些服務。
雖然這個清單并不完整,但它足以讓你理解運行時基于的由ves提供的低層架構??隙▽袑iT討論運行時的書,而這本書將稍為深入地挖掘各種話題。
2.3 小結
這一章,我帶你逛了一回運行時的世界。我描述了當創建、編譯和配置c#程序時它是如何工作的。你學會了中間語言(il),還有元數據是如何用于描述被編譯為il的類型。元數據和il都用于jitter檢測和執行你的代碼。你甚至可以選擇用哪一種jitter來執行應用程序。
在這一章的第二部分,涉及到了運行時為何按這種方式工作的理論。你學了虛擬對象系統(vos)和組成它的那部分。對于類庫設計者最為感興趣的就是通用語言規范(cls),它為基于vos的語言交互操作設定規則。最后,你看到了虛擬執行系統(ves)如何通過ngws runtime實現vos。
本文來源于網頁設計愛好者web開發社區http://www.html.org.cn收集整理,歡迎訪問。