国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 學院 > 開發設計 > 正文

java中文問題

2019-11-18 13:57:57
字體:
來源:轉載
供稿:網友

  寫在前面的話:



java中文問題一直是困饒著初學java的主要問題,而且即使接觸java有一段時間的“老手”也經常會在java的中文問題上栽跟頭。下面就我個人理解,對Java中文問題進行一些闡釋。

理解Java內部關于編碼的原理:



Java內部是Unicode編碼,所謂Unicode編碼即是:全世界所有符號進行了統一編碼的結果。但是有一點值得提出一下,用它來處理漢字是合適的,但是英文卻吃虧了,要用多一倍的空間來存儲。所以程序員們寫的程序不支持UNICODE情況很常見。

其他相關編碼方式還有(說一些和中文相關的大家也許經常見到的編碼方式):GB2312和GBK。其中GB2312是對GBK的升級,GBK是GB2312的一個子集,例如GB2312可以支持繁體字。BIG5是臺灣編碼方式。ISO8859-1編碼:ISO8859_1,這個是英文系統缺省的8bit編碼,因為是8bit的,所以不會把漢字的高位刪去,所以用它也是可以處理漢字的。





理解Java的IO機制:



Java的IO基類分為:InputStream、OutputStream和Reader、Writer

在I/O時假如使用Reader/Writer就要發生編碼轉換,使用系統屬性file.encoding作為編碼方式。假如使用Stream就沒有轉換的事情了,那是Binary的數據。

1、在Reader/Writer上加encoding的選項時候,在Reader中的encoding表示把數據從encoding轉換成Unicode,writer就是把Unicode的字符轉換成encoding格式的。





2、用String.getByte()把字符串轉換成指定編碼。





jsp/Servlet問題:



JSP/Servlet的中文問題有兩種解決辦法:

1、 不在程序中進行編碼轉換,把這個工作交給瀏覽器,方法就是用javac ?Cencoding GBK *.java來編譯所有的bean,然后在JSP頁面上加
<%@ page contentType="text/Html;charset=gb2312" %>或者是在HTML中直接加: <meta http-equiv="Content-Type" content="text/html; charset=gb2312">
到底加那個,試試就知道了。

2、 在程序中指定編碼,用javac ?Cencoding ISO8859_1 *.java來編譯所有的bean,在涉及到中文顯示的程序上加
str=new String(str.getBytes("ISO8859_1"));

上面兩種方法不能混用,意思就是要么就是GBK,要么就是ISO8859_1,從里到外都一樣就好了。

另外一個好辦法就是采用filter:

import javax.servlet.*;

import java.io.*;





public class RequestEncodeFilter implements Filter {





String charset = null;





public void init(FilterConfig config) throws ServletException {

charset = config.getInitParameter("charset");

if (charset == null)

charset = "GBK";

}





public void doFilter(ServletRequest request, ServletResponse response,

FilterChain chain) throws IOException,

ServletException {

request.setCharacterEncoding(charset);

chain.doFilter(request, response);

}





public void destroy() {





}

}





在你的web.xml配置好fillter就可以了。這個方法是最便捷的,基本可以實現讓java程序員原理中文問題。





數據庫JDBC的中文問題:

一般只要按照數據庫指定的編碼進行轉換,比如按照ISO8859_1讀,ISO8859_1寫,一般就沒什么問題了。我也碰到過一些例外情況,如:對于存儲的代碼不進行轉碼機制,在數據庫中存儲的是亂碼。但是,讀取的時候卻是正常的中文。我想這正好是Unicodeà特定coding?>Unicode編碼,所以湊巧碰上了吧,我想數據庫內部處理過程在起作用吧,當然我們誰也不喜歡一打開數據庫看到的是一堆亂碼。那就還是按照自己指定的方式來進行轉碼解碼吧。





另外一種辦法是:在JDBC連接數據庫過程就進行字符編碼轉換:

如:ConnectionString="jdbc:MySQL://localhost/dbname?user=root&passWord=dphw&useUnicode=true&characterEncoding=8859_1(mysql的例子)





java和javaw:



他們的區別就不多說了,主要是java會在黑窗口下進行,而javaw不會,所以例如jb這樣的開發工具都是默認采用javaw來進行run這些java的class的。

但是有一點需要提出的是:

javaw會使用與java不同的Local配置進行工作,導致了一些中文問題,而java就是好好的。JBuilder也是好好的,沒有問題,調用javaw也不是它的錯,難道你想每次運行或者調試的時候蹦出個DOS黑框么?

可以采用如下辦法解決jb中的javaw造成的中文問題。

在JBuilder中選擇PRoject->Project Properties->run->edit->VM Parameters,填上-Dfile.encoding=GBK -Ddefault.client.encoding=GBK -Duser.language=zh -Duser.region=CN 就行了!

原理也就是在javaw加上如上的配置參數。





其他配置方面:



在JDK低版本和UNIX下,需要改動font.properties,讓JAVA VM能夠找到合適的字體來顯示漢字。





總結:



上面就我所接觸的幾個方面談談java的中文問題。其中包括理解Java內部關于編碼的原理、理解Java的IO機制、JSP/Servlet問題、 數據庫JDBC的中文問題、java和javaw、其他配置方面。

肯定會有許多疏漏的地方,希望各位給予補充。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 红桥区| 古交市| 武隆县| 齐河县| 大埔县| 定结县| 太白县| 都兰县| 垦利县| 土默特左旗| 年辖:市辖区| 鄄城县| 西乌珠穆沁旗| 任丘市| 宣城市| 永新县| 横峰县| 蒙自县| 景宁| 南木林县| 峨眉山市| 绥宁县| 巴彦县| 苏州市| 宣化县| 崇州市| 嘉义县| 清新县| 耿马| 高唐县| 芦溪县| 安龙县| 英山县| 长寿区| 舞阳县| 东安县| 连云港市| 磐石市| 昭苏县| 九江市| 荆门市|