URL和URI
URL和URLConnection類(lèi)封裝了大量復(fù)雜的實(shí)現(xiàn)細(xì)節(jié),這些細(xì)節(jié)涉及如何從遠(yuǎn)程站點(diǎn)獲取信息。例如,可以通過(guò)傳遞字符串來(lái)構(gòu)建一個(gè)URL對(duì)象 :
URL url = new URL(String);如果只是想獲得該資源的內(nèi)容,可以使用URL類(lèi)中的openStream方法。該方法返回一個(gè)InputStream對(duì)象,然后就可以按照一般的用法來(lái)使用這個(gè)對(duì)象了,比如用它構(gòu)建一個(gè)Scanner對(duì)象。java.net包對(duì)統(tǒng)一資源定位符(uniform resource locator,URL)和統(tǒng)一資源標(biāo)識(shí)符(uniform resource identifier,URI)作了非常有用的區(qū)分。URI是個(gè)純粹的句法結(jié)構(gòu),用于指定標(biāo)識(shí)Web資源的字符串的各個(gè)不同部分。URL是URI的一個(gè)特例,它包含了用于定位Web資源的足夠信息 。在Java類(lèi)庫(kù)中,URI類(lèi)不包含任何用于訪問(wèn)資源的方法,它的惟一作用就是解析。相反的是,URL類(lèi)可以打開(kāi)一個(gè)到達(dá)資源的流。因此,URL類(lèi)只能作用于那些Java類(lèi)庫(kù)知道該如何處理的模式,例如http:、https:、ftp:、本地文件系統(tǒng)(file:)和JAR文件(jar:)。
URI規(guī)范給出了標(biāo)記這些標(biāo)識(shí)符的規(guī)則 。一個(gè)URI具有以下句法 :
[scheme:]schemeSpecificPart[#fragment][ . . . ]表示可選部分,它與:和#可以被包含在標(biāo)識(shí)符內(nèi) .包含scheme:部分的URI被稱(chēng)為絕對(duì)URI。否則,被稱(chēng)為相對(duì)URI。如果絕對(duì)URI的schemeSpecificPart不是以/開(kāi)頭的,我們就稱(chēng)它是不透明的 。所有絕對(duì)的透明URI和所有相對(duì)URI都是分層的(hierarchical)。一個(gè)分層URI的schemeSpecificPart具有以下結(jié)構(gòu)
[//authority][path][?query]對(duì)于那些基于服務(wù)器的URI,authority部分采用以下形式[user-info@]host[:port]URI類(lèi)的作用之一是解析標(biāo)識(shí)符并將它分解成各種不同的組成部分 。URI類(lèi)的另一個(gè)作用是處理絕對(duì)標(biāo)識(shí)符和相對(duì)標(biāo)識(shí)符。http://xxx/a/b/c.html和../a/b/c.html#xxx可以合為http://xxx/a/b/c.html#xxx這個(gè)過(guò)程被稱(chēng)為相對(duì)URL的轉(zhuǎn)換( resolving)。 與此相反的過(guò)程稱(chēng)為相對(duì)化(relativization)。使用URLConnection獲取信息如果想從某個(gè)Web資源獲取更多信息,那么應(yīng)該使用URLConnection類(lèi),它能得到比基本的URL類(lèi)更多的控制功能。1.調(diào)用URL類(lèi)中的openConnection方法獲得URLConnection對(duì)象
URLConnection uc = url.openConnection();2.設(shè)置任意的請(qǐng)求屬性 3.調(diào)用connect方法連接遠(yuǎn)程資源uc.connect();4.與服務(wù)器建立連接后,你可以查詢(xún)頭信息。 getHeaderFieldKey和getHeaderField兩個(gè)方法列舉了消息頭的所有字段getHeaderFields方法返回一個(gè)包含了消息頭中所有字段的標(biāo)準(zhǔn)Map對(duì)象。5. 最后,訪問(wèn)資源數(shù)據(jù)。使用getInputStream方法獲取一個(gè)輸入流用以讀取信息(這個(gè)輸入流與URL類(lèi)中的openStream方法所返回的流相同)。另一個(gè)方法getContent在實(shí)際操作中并不是很有用。在默認(rèn)情況下建立的連接只有從服務(wù)器讀取信息的輸入流,并沒(méi)有任何執(zhí)行寫(xiě)操作的輸出流。如果想獲得輸出流(例如,向一個(gè)Web服務(wù)器提交數(shù)據(jù)),那么你需要調(diào)用 uc.setDoOutput(true);接下來(lái),也許想設(shè)置某些請(qǐng)求頭(request header)。請(qǐng)求頭是與請(qǐng)求命令一起被發(fā)送到服務(wù)器的。
setIfModifiedSince方法用于告訴連接你只對(duì)自某個(gè)特定日期以來(lái)被修改過(guò)的數(shù)據(jù)感興趣;setUseCaches和setAllowUserInteraction這兩個(gè)方法只作用于Applet;setUseCaches方法用于命令瀏覽器首先檢查它的緩存;setAllowUserInteraction方法則用于在訪問(wèn)有密碼保護(hù)的資源時(shí)彈出對(duì)話框。setRequestPRoperty,它可以用來(lái)設(shè)置對(duì)特定協(xié)議起作用的任何“名-值(name/value)對(duì)”。例如,如果你想訪問(wèn)一個(gè)有口令保護(hù)的Web頁(yè)
1.將用戶(hù)名、冒號(hào)和口令以字符串形式連接在一起
String string=username+":"+passWord;2.計(jì)算上一步驟所得字符串的base64編碼。(base64編碼用于將字節(jié)流編碼成可打印的ASCII字符流。)String code =base64Encode(string);3.調(diào)用setRequestProperty方法,設(shè)置name參數(shù)的值為“Authorization”、value參數(shù)的值為“ Basic”+encoding .uc.setRequestProperty("Authorization","Basic"+code);一旦調(diào)用了connect方法,就可以查詢(xún)響應(yīng)頭信息。首先,我們將介紹如何列舉所有響應(yīng)頭的字段。似乎是為了展示自己的個(gè)性,該操作采用了另一種迭代方式。String key = uc.getHeaderFieldKey(n); 可以獲得響應(yīng)頭的第n個(gè)鍵,其中n從1開(kāi)始。如果n為0或大于消息頭的字段總數(shù),該方法將返回null值。沒(méi)有哪種方法可以返回字段的數(shù)量,你必須反復(fù)調(diào)用getHeaderFieldKey方法直到返回null為止。String value=uc.getHeaderField(n); getHeaderFields方法可以返回一個(gè)封裝了響應(yīng)頭字段的Map對(duì)象 。Map<String,List<String>> map = uc.getHeaderFields(); 為了簡(jiǎn)便起見(jiàn),Java提供了6個(gè)方法用以訪問(wèn)大多數(shù)常用的消息頭類(lèi)型的值,并在需要的時(shí)候?qū)⑺鼈冝D(zhuǎn)換成數(shù)字類(lèi)型。返回類(lèi)型為long的方法返回的是從格林尼治時(shí)間1970年1月1日開(kāi)始計(jì)算的秒數(shù)。Date getdate longExpires getExpiration longLast-Modified getLastModified longContent-Length getContentLength intContent-Type getContentType StringContent-Encoding getContentEncoding String 除了base64編碼的計(jì)算稍顯復(fù)雜之外,程序的其他部分非常簡(jiǎn)單明了。有一個(gè)類(lèi)sun.misc.BASE64Encoder,雖然沒(méi)有被歸檔,但是可以用它來(lái)代替我們?cè)谑纠绦蛑刑峁┑念?lèi)。URL url = new URL("http://www.baidu.com"); URLConnection connection = url.openConnection(); connection.connect(); Map<String,List<String>>map = connection.getHeaderFields(); for(Map.Entry<String, List<String>> a:map.entrySet()){ String b = a.getKey(); for(String c:a.getValue()){ System.out.println(b+":"+c); } } System.out.println(connection.getDate()); System.out.println(connection.getContentLength()); System.out.println(connection.getContentEncoding()); System.out.println(connection.getLastModified()); System.out.println(connection.getContentType()); System.out.println(connection.getExpiration()); Scanner scanner = new Scanner(connection.getInputStream()); while(scanner.hasNextLine()){ System.out.println(scanner.nextLine()); }URLEncoderstatic String encode(String s, String encoding)采用指定的字符編碼模式(推薦使用“ UTF-8”)對(duì)字符串s進(jìn)行編碼,并返回它的URL編碼形式。在URL編碼中, 'A' - 'Z', 'a' - 'z', '0' - '9', '-', '_', '.'和'*'等字符保持不變,空格被編碼成'+',所有其他字符被編碼成"%XY"形式的字節(jié)序列,其中0xXY為該字節(jié)十六進(jìn)制數(shù)URLDecoderstatic string decode(String s, String encoding) 采用指定編碼模式對(duì)已編碼字符串s進(jìn)行解碼,并返回結(jié)果。URLConnectionvoid setDoInput(boolean doInput)boolean getDoInput()如果doInput為true,那么用戶(hù)可以接收來(lái)自該URLConnection的輸入。void setDoOutput(boolean doOutput)boolean getDoOutput()如果doOutput為true,那么用戶(hù)可以將輸出發(fā)送到該URLConnection。void setIfModifiedSince(long time)long getIfModifiedSince()屬性ifModifiedSince用于配置URLConnection對(duì)象,使它只獲取那些自從某個(gè)給定時(shí)間以來(lái)被修改過(guò)的數(shù)據(jù)。調(diào)用方法時(shí)需要傳入的time參數(shù)指的是從格林尼治時(shí)間1970年1月1日午夜開(kāi)始計(jì)算的秒數(shù)。void setUseCaches(boolean useCaches)boolean getUseCaches()如果useCaches為true,那么數(shù)據(jù)可以從本地緩存中得到。請(qǐng)注意, URLConnection本身并不維護(hù)這樣一個(gè)緩存,緩存必須由瀏覽器之類(lèi)的外部程序提供。void setAllowUserInteraction(boolean allowUserInteraction)boolean getAllowsUserInteraction()如果allowUserInteraction為true,那么可以查詢(xún)用戶(hù)的口令。請(qǐng)注意,URLConnection本身并不提供這種查詢(xún)功能。查詢(xún)必須由瀏覽器或?yàn)g覽器插件之類(lèi)的外部程序?qū)崿F(xiàn)。void setConnectTimeout(int timeout) int getConnectTimeout() 設(shè)置或得到連接超時(shí)時(shí)限(單位:毫秒)。如果在連接建立之前就已經(jīng)達(dá)到了超時(shí)的時(shí)限,那么輸入流的connect方法就會(huì)拋出一個(gè)SocketTimeoutException異常。void setReadTimeout(int timeout) int getReadTimeout() 5.0設(shè)置讀取數(shù)據(jù)的超時(shí)時(shí)限(單位:毫秒)。如果在一個(gè)讀操作成功之前就已經(jīng)達(dá)到了超時(shí)的時(shí)限,那么read方法就會(huì)拋出一個(gè)SocketTimeoutException異常。void setRequestProperty(String key, String value)設(shè)置請(qǐng)求頭的一個(gè)字段。Map<String,List<String>> getRequestProperties()返回請(qǐng)求頭屬性的一個(gè)映射表。相同的鍵對(duì)應(yīng)的所有值被放置在同一個(gè)映射表中。void connect()連接遠(yuǎn)程資源并獲取響應(yīng)頭信息。Map<String,List<String>> Map getHeaderFields() 返回響應(yīng)的一個(gè)映射表。相同的鍵對(duì)應(yīng)的所有值被放置在同一個(gè)映射表中。String getHeaderFieldKey(int n)得到響應(yīng)頭第n個(gè)字段的鍵。如果n等于0或大于響應(yīng)頭字段的總數(shù),該方法返回null值。String getHeaderField(int n)得到響應(yīng)頭第n個(gè)字段的值。如果n等于0或大于響應(yīng)頭字段的總數(shù),該方法返回null值。int getContentLength()如果知道內(nèi)容長(zhǎng)度,則返回該長(zhǎng)度值,否則返回-1。String getContentType獲取內(nèi)容的類(lèi)型,比如text/plain或image/gif。String getContentEncoding()獲取內(nèi)容的編碼,比如gzip。這個(gè)值不太常用,因?yàn)槟J(rèn)的identity編碼并不是用ContentEncoding頭來(lái)設(shè)定的。long getDate()long getExpiration()long getLastModifed()獲取創(chuàng)建日期、過(guò)期日以及最后一次被修改的日期。這些日期指的是從格林尼治時(shí)間1970年1月1日午夜開(kāi)始計(jì)算的秒數(shù)。InputStream getInputStream()OutputStream getOutputStream()返回從資源讀取信息或向資源寫(xiě)入信息的流。Object getContent()選擇適當(dāng)?shù)膬?nèi)容處理器,以便讀取資源數(shù)據(jù)并將它轉(zhuǎn)換成對(duì)象。該方法不能用于讀取諸如text/plain或image/gif之類(lèi)的標(biāo)準(zhǔn)內(nèi)容類(lèi)型,除非你安裝了自己的內(nèi)容處理器。
新聞熱點(diǎn)
疑難解答
圖片精選
網(wǎng)友關(guān)注