本文實例講述了Java實現將漢字轉化為漢語拼音的方法。分享給大家供大家參考,具體如下:
網上亂轉,偶然看到一個很有意思的小工具,名字叫pinyin4j,可以把漢字轉換為漢語拼音,利用他的話再配合上lucene、中文分詞就可以做出類似google那種輸入漢語拼音進行全文檢索的功能了。實現的代碼如下
package pinyin4j;import net.sourceforge.pinyin4j.PinyinHelper;import net.sourceforge.pinyin4j.format.HanyuPinyinCaseType;import net.sourceforge.pinyin4j.format.HanyuPinyinOutputFormat;import net.sourceforge.pinyin4j.format.HanyuPinyinToneType;import net.sourceforge.pinyin4j.format.HanyuPinyinVCharType;import net.sourceforge.pinyin4j.format.exception.BadHanyuPinyinOutputFormatCombination;public class pinyin4jTest { public static void main(String argsp[]) { try { String output = pinyin4jTest.CNToPinyin("你和你好", null); System.out.println(output); } catch (BadHanyuPinyinOutputFormatCombination e) { // TODO Auto-generated catch block e.printStackTrace(); } } /** * @parm inputCN 輸入的中文字符串 * @parm seg 輸出漢語拼音時的分隔符 * * HanyuPinyinOutputFormat提供了幾種輸出模式 * HanyuPinyinCaseType:設定輸入的結果是大寫英文還是小寫英文 LOWERCASE :小寫 UPPERCASE :大寫 * HanyuPinyinToneType:輸出是否表明音調和重音 WITH_TONE_NUMBER:標明音調 如YE1 1-4表示 1-4聲 * WITHOUT_TONE:不顯示音調符 HanyuPinyinVCharType :輸出要用何種的拼音編碼 */ public static String CNToPinyin(String inputCN, String seg) throws BadHanyuPinyinOutputFormatCombination { char[] inputArray = inputCN.toCharArray(); if (seg == null) seg = " "; HanyuPinyinOutputFormat format = new HanyuPinyinOutputFormat(); format.setCaseType(HanyuPinyinCaseType.LOWERCASE); format.setToneType(HanyuPinyinToneType.WITHOUT_TONE); format.setVCharType(HanyuPinyinVCharType.WITH_V); String output = ""; String[] temp = new String[10]; for (int i = 0; i < inputArray.length; i++) { temp = PinyinHelper.toHanyuPinyinStringArray(inputArray[i], format); //若輸入的漢字為多音字則會將不同的讀音依次放入temp[]中,若不是多音字則只有temp[0]中有值 for (int j = 0; j < temp.length; j++) { output += temp[j] + seg; } } return output; }}
希望本文所述對大家Java程序設計有所幫助。
|
新聞熱點
疑難解答