URL和URI
URL和URLConnection類封裝了大量復(fù)雜的實現(xiàn)細節(jié),這些細節(jié)涉及如何從遠程站點獲取信息。例如,可以通過傳遞字符串來構(gòu)建一個URL對象 :
URL url = new URL(String);如果只是想獲得該資源的內(nèi)容,可以使用URL類中的openStream方法。該方法返回一個InputStream對象,然后就可以按照一般的用法來使用這個對象了,比如用它構(gòu)建一個Scanner對象。java.net包對統(tǒng)一資源定位符(uniform resource locator,URL)和統(tǒng)一資源標(biāo)識符(uniform resource identifier,URI)作了非常有用的區(qū)分。URI是個純粹的句法結(jié)構(gòu),用于指定標(biāo)識Web資源的字符串的各個不同部分。URL是URI的一個特例,它包含了用于定位Web資源的足夠信息 。在Java類庫中,URI類不包含任何用于訪問資源的方法,它的惟一作用就是解析。相反的是,URL類可以打開一個到達資源的流。因此,URL類只能作用于那些Java類庫知道該如何處理的模式,例如http:、https:、ftp:、本地文件系統(tǒng)(file:)和JAR文件(jar:)。
URI規(guī)范給出了標(biāo)記這些標(biāo)識符的規(guī)則 。一個URI具有以下句法 :
[scheme:]schemeSpecificPart[#fragment][ . . . ]表示可選部分,它與:和#可以被包含在標(biāo)識符內(nèi) .包含scheme:部分的URI被稱為絕對URI。否則,被稱為相對URI。如果絕對URI的schemeSpecificPart不是以/開頭的,我們就稱它是不透明的 。所有絕對的透明URI和所有相對URI都是分層的(hierarchical)。一個分層URI的schemeSpecificPart具有以下結(jié)構(gòu)
[//authority][path][?query]對于那些基于服務(wù)器的URI,authority部分采用以下形式[user-info@]host[:port]URI類的作用之一是解析標(biāo)識符并將它分解成各種不同的組成部分 。URI類的另一個作用是處理絕對標(biāo)識符和相對標(biāo)識符。http://xxx/a/b/c.html和../a/b/c.html#xxx可以合為http://xxx/a/b/c.html#xxx這個過程被稱為相對URL的轉(zhuǎn)換( resolving)。 與此相反的過程稱為相對化(relativization)。使用URLConnection獲取信息如果想從某個Web資源獲取更多信息,那么應(yīng)該使用URLConnection類,它能得到比基本的URL類更多的控制功能。1.調(diào)用URL類中的openConnection方法獲得URLConnection對象
URLConnection uc = url.openConnection();2.設(shè)置任意的請求屬性 3.調(diào)用connect方法連接遠程資源uc.connect();4.與服務(wù)器建立連接后,你可以查詢頭信息。 getHeaderFieldKey和getHeaderField兩個方法列舉了消息頭的所有字段getHeaderFields方法返回一個包含了消息頭中所有字段的標(biāo)準(zhǔn)Map對象。5. 最后,訪問資源數(shù)據(jù)。使用getInputStream方法獲取一個輸入流用以讀取信息(這個輸入流與URL類中的openStream方法所返回的流相同)。另一個方法getContent在實際操作中并不是很有用。在默認(rèn)情況下建立的連接只有從服務(wù)器讀取信息的輸入流,并沒有任何執(zhí)行寫操作的輸出流。如果想獲得輸出流(例如,向一個Web服務(wù)器提交數(shù)據(jù)),那么你需要調(diào)用 uc.setDoOutput(true);接下來,也許想設(shè)置某些請求頭(request header)。請求頭是與請求命令一起被發(fā)送到服務(wù)器的。
setIfModifiedSince方法用于告訴連接你只對自某個特定日期以來被修改過的數(shù)據(jù)感興趣;setUseCaches和setAllowUserInteraction這兩個方法只作用于Applet;setUseCaches方法用于命令瀏覽器首先檢查它的緩存;setAllowUserInteraction方法則用于在訪問有密碼保護的資源時彈出對話框。setRequestPRoperty,它可以用來設(shè)置對特定協(xié)議起作用的任何“名-值(name/value)對”。例如,如果你想訪問一個有口令保護的Web頁
1.將用戶名、冒號和口令以字符串形式連接在一起
String string=username+":"+passWord;2.計算上一步驟所得字符串的base64編碼。(base64編碼用于將字節(jié)流編碼成可打印的ASCII字符流。)String code =base64Encode(string);3.調(diào)用setRequestProperty方法,設(shè)置name參數(shù)的值為“Authorization”、value參數(shù)的值為“ Basic”+encoding .uc.setRequestProperty("Authorization","Basic"+code);一旦調(diào)用了connect方法,就可以查詢響應(yīng)頭信息。首先,我們將介紹如何列舉所有響應(yīng)頭的字段。似乎是為了展示自己的個性,該操作采用了另一種迭代方式。String key = uc.getHeaderFieldKey(n); 可以獲得響應(yīng)頭的第n個鍵,其中n從1開始。如果n為0或大于消息頭的字段總數(shù),該方法將返回null值。沒有哪種方法可以返回字段的數(shù)量,你必須反復(fù)調(diào)用getHeaderFieldKey方法直到返回null為止。String value=uc.getHeaderField(n); getHeaderFields方法可以返回一個封裝了響應(yīng)頭字段的Map對象 。Map<String,List<String>> map = uc.getHeaderFields(); 為了簡便起見,Java提供了6個方法用以訪問大多數(shù)常用的消息頭類型的值,并在需要的時候?qū)⑺鼈冝D(zhuǎn)換成數(shù)字類型。返回類型為long的方法返回的是從格林尼治時間1970年1月1日開始計算的秒數(shù)。Date getdate longExpires getExpiration longLast-Modified getLastModified longContent-Length getContentLength intContent-Type getContentType StringContent-Encoding getContentEncoding String 除了base64編碼的計算稍顯復(fù)雜之外,程序的其他部分非常簡單明了。有一個類sun.misc.BASE64Encoder,雖然沒有被歸檔,但是可以用它來代替我們在示例程序中提供的類。URL url = new URL("http://www.baidu.com"); URLConnection connection = url.openConnection(); connection.connect(); Map<String,List<String>>map = connection.getHeaderFields(); for(Map.Entry<String, List<String>> a:map.entrySet()){ String b = a.getKey(); for(String c:a.getValue()){ System.out.println(b+":"+c); } } System.out.println(connection.getDate()); System.out.println(connection.getContentLength()); System.out.println(connection.getContentEncoding()); System.out.println(connection.getLastModified()); System.out.println(connection.getContentType()); System.out.println(connection.getExpiration()); Scanner scanner = new Scanner(connection.getInputStream()); while(scanner.hasNextLine()){ System.out.println(scanner.nextLine()); }URLEncoderstatic String encode(String s, String encoding)采用指定的字符編碼模式(推薦使用“ UTF-8”)對字符串s進行編碼,并返回它的URL編碼形式。在URL編碼中, 'A' - 'Z', 'a' - 'z', '0' - '9', '-', '_', '.'和'*'等字符保持不變,空格被編碼成'+',所有其他字符被編碼成"%XY"形式的字節(jié)序列,其中0xXY為該字節(jié)十六進制數(shù)URLDecoderstatic string decode(String s, String encoding) 采用指定編碼模式對已編碼字符串s進行解碼,并返回結(jié)果。URLConnectionvoid setDoInput(boolean doInput)boolean getDoInput()如果doInput為true,那么用戶可以接收來自該URLConnection的輸入。void setDoOutput(boolean doOutput)boolean getDoOutput()如果doOutput為true,那么用戶可以將輸出發(fā)送到該URLConnection。void setIfModifiedSince(long time)long getIfModifiedSince()屬性ifModifiedSince用于配置URLConnection對象,使它只獲取那些自從某個給定時間以來被修改過的數(shù)據(jù)。調(diào)用方法時需要傳入的time參數(shù)指的是從格林尼治時間1970年1月1日午夜開始計算的秒數(shù)。void setUseCaches(boolean useCaches)boolean getUseCaches()如果useCaches為true,那么數(shù)據(jù)可以從本地緩存中得到。請注意, URLConnection本身并不維護這樣一個緩存,緩存必須由瀏覽器之類的外部程序提供。void setAllowUserInteraction(boolean allowUserInteraction)boolean getAllowsUserInteraction()如果allowUserInteraction為true,那么可以查詢用戶的口令。請注意,URLConnection本身并不提供這種查詢功能。查詢必須由瀏覽器或瀏覽器插件之類的外部程序?qū)崿F(xiàn)。void setConnectTimeout(int timeout) int getConnectTimeout() 設(shè)置或得到連接超時時限(單位:毫秒)。如果在連接建立之前就已經(jīng)達到了超時的時限,那么輸入流的connect方法就會拋出一個SocketTimeoutException異常。void setReadTimeout(int timeout) int getReadTimeout() 5.0設(shè)置讀取數(shù)據(jù)的超時時限(單位:毫秒)。如果在一個讀操作成功之前就已經(jīng)達到了超時的時限,那么read方法就會拋出一個SocketTimeoutException異常。void setRequestProperty(String key, String value)設(shè)置請求頭的一個字段。Map<String,List<String>> getRequestProperties()返回請求頭屬性的一個映射表。相同的鍵對應(yīng)的所有值被放置在同一個映射表中。void connect()連接遠程資源并獲取響應(yīng)頭信息。Map<String,List<String>> Map getHeaderFields() 返回響應(yīng)的一個映射表。相同的鍵對應(yīng)的所有值被放置在同一個映射表中。String getHeaderFieldKey(int n)得到響應(yīng)頭第n個字段的鍵。如果n等于0或大于響應(yīng)頭字段的總數(shù),該方法返回null值。String getHeaderField(int n)得到響應(yīng)頭第n個字段的值。如果n等于0或大于響應(yīng)頭字段的總數(shù),該方法返回null值。int getContentLength()如果知道內(nèi)容長度,則返回該長度值,否則返回-1。String getContentType獲取內(nèi)容的類型,比如text/plain或image/gif。String getContentEncoding()獲取內(nèi)容的編碼,比如gzip。這個值不太常用,因為默認(rèn)的identity編碼并不是用ContentEncoding頭來設(shè)定的。long getDate()long getExpiration()long getLastModifed()獲取創(chuàng)建日期、過期日以及最后一次被修改的日期。這些日期指的是從格林尼治時間1970年1月1日午夜開始計算的秒數(shù)。InputStream getInputStream()OutputStream getOutputStream()返回從資源讀取信息或向資源寫入信息的流。Object getContent()選擇適當(dāng)?shù)膬?nèi)容處理器,以便讀取資源數(shù)據(jù)并將它轉(zhuǎn)換成對象。該方法不能用于讀取諸如text/plain或image/gif之類的標(biāo)準(zhǔn)內(nèi)容類型,除非你安裝了自己的內(nèi)容處理器。
新聞熱點
疑難解答