国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁(yè) > 編程 > JSP > 正文

JSP/Servlet 中的漢字編碼問(wèn)題

2020-06-01 23:30:28
字體:
來(lái)源:轉(zhuǎn)載
供稿:網(wǎng)友

JSP/Servlet 中的漢字編碼問(wèn)題網(wǎng)上就 JSP/Servlet 中 DBCS 字符編碼問(wèn)題有許多優(yōu)秀的文章和討論,本文對(duì)它們作一些整理,并結(jié)合 IBM WebSphere Application Server 3.5(WAS)的解決方法作一些說(shuō)明,希望它不是多余的。
內(nèi)容:


問(wèn)題的起源
??????-80,GBK,GB18030-2000 漢字字符集及 Encoding
中文轉(zhuǎn)碼時(shí)'?'、亂碼的由來(lái)
JSP/Servlet 漢字編碼問(wèn)題及在 WAS 中的解決辦法
結(jié)束語(yǔ)
參考文章

1. 問(wèn)題的起源

每個(gè)國(guó)家(或區(qū)域)都規(guī)定了計(jì)算機(jī)信息交換用的字符編碼集,如美國(guó)的擴(kuò)展 ASCII碼, 中國(guó)的 ??????-80,日本的 JIS 等,作為該國(guó)家/區(qū)域內(nèi)信息處理的基礎(chǔ),有著統(tǒng)一編碼的重要作用。字符編碼集按長(zhǎng)度分為 SBCS(單字節(jié)字符集),DBCS(雙字節(jié)字符集)兩大類(lèi)。早期的軟件(尤其是操作系統(tǒng)),為了解決本地字符信息的計(jì)算機(jī)處理,出現(xiàn)了各種本地化版本(L10N),為了區(qū)分,引進(jìn)了 LANG, Codepage 等概念。但是由于各個(gè)本地字符集代碼范圍重疊,相互間信息交換困難;軟件各個(gè)本地化版本獨(dú)立維護(hù)成本較高。因此有必要將本地化工作中的共性抽取出來(lái),作一致處理,將特別的本地化處理內(nèi)容降低到最少。這也就是所謂的國(guó)際化(I18N)。各種語(yǔ)言信息被進(jìn)一步規(guī)范為 Locale 信息。處理的底層字符集變成了幾乎包含了所有字形的 Unicode。

現(xiàn)在大部分具有國(guó)際化特征的軟件核心字符處理都是以 Unicode 為基礎(chǔ)的,在軟件運(yùn)行時(shí)根據(jù)當(dāng)時(shí)的 Locale/Lang/Codepage 設(shè)置確定相應(yīng)的本地字符編碼設(shè)置,并依此處理本地字符。在處理過(guò)程中需要實(shí)現(xiàn) Unicode 和本地字符集的相互轉(zhuǎn)換,甚或以 Unicode 為中間的兩個(gè)不同本地字符集的相互轉(zhuǎn)換。這種方式在網(wǎng)絡(luò)環(huán)境下被進(jìn)一步延伸,任何網(wǎng)絡(luò)兩端的字符信息也需要根據(jù)字符集的設(shè)置轉(zhuǎn)換成可接受的內(nèi)容。

Java 語(yǔ)言?xún)?nèi)部是用 Unicode 表示字符的,遵守 Unicode V2.0。Java 程序無(wú)論是從/往文件系統(tǒng)以字符流讀/寫(xiě)文件,還是往 URL 連接寫(xiě) HTML 信息,或從 URL 連接讀取參數(shù)值,都會(huì)有字符編碼的轉(zhuǎn)換。這樣做雖然增加了編程的復(fù)雜度,容易引起混淆,但卻是符合國(guó)際化的思想的。

從理論上來(lái)說(shuō),這些根據(jù)字符集設(shè)置而進(jìn)行的字符轉(zhuǎn)換不應(yīng)該產(chǎn)生太多問(wèn)題。而事實(shí)是由于應(yīng)用程序的實(shí)際運(yùn)行環(huán)境不同,Unicode 和各個(gè)本地字符集的補(bǔ)充、完善,以及系統(tǒng)或應(yīng)用程序?qū)崿F(xiàn)的不規(guī)范,轉(zhuǎn)碼時(shí)出現(xiàn)的問(wèn)題時(shí)時(shí)困擾著程序員和用戶(hù)。

2. ??????-80,GBK,GB18030-2000 漢字字符集及 Encoding

其實(shí)解決 JAVA 程序中的漢字編碼問(wèn)題的方法往往很簡(jiǎn)單,但理解其背后的原因,定位問(wèn)題,還需要了解現(xiàn)有的漢字編碼和編碼轉(zhuǎn)換。

??????-80 是在國(guó)內(nèi)計(jì)算機(jī)漢字信息技術(shù)發(fā)展初始階段制定的,其中包含了大部分常用的一、二級(jí)漢字,和 9 區(qū)的符號(hào)。該字符集是幾乎所有的中文系統(tǒng)和國(guó)際化的軟件都支持的中文字符集,這也是最基本的中文字符集。其編碼范圍是高位0xa1-0xfe,低位也是 0xa1-0xfe;漢字從 0xb0a1 開(kāi)始,結(jié)束于 0xf7fe;
發(fā)表評(píng)論 共有條評(píng)論
用戶(hù)名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 蓬安县| 读书| 文登市| 奎屯市| 克拉玛依市| 株洲市| 南乐县| 佛山市| 山东省| 邵武市| 靖西县| 梅州市| 古交市| 云霄县| 嘉祥县| 凭祥市| 扬中市| 麻栗坡县| 延边| 罗山县| 博客| 奉节县| 石狮市| 呼伦贝尔市| 桃源县| 谢通门县| 湘阴县| 洛浦县| 嘉荫县| 鹤岗市| 开化县| 长寿区| 南充市| 德保县| 莲花县| 辽阳市| 陕西省| 黑龙江省| 定西市| 尚义县| 柘城县|