国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 學院 > 開發設計 > 正文

關于C#(生僻字、繁體字)和Java的URL轉碼GBK后結果不一樣的問題解決

2019-11-17 03:07:03
字體:
來源:轉載
供稿:網友

關于C#(生僻字、繁體字)和java的URL轉碼GBK后結果不一樣的問題解決

業務背景:

服務端是用Java寫的,客戶端的是使用C#寫的,他們交互以客戶端以http協議方式請求服務端,http請求方式要求URL轉碼為GBK。但是后來發現,服務端收到客戶端提交的GBK字符,偶爾會有亂碼。于是將同一個字符串分別用URL轉換GBK,然后發現只有一點點不一樣。示例如下: 字符串:赟俶鎮臨釵閣紅昇號瀍業區號鋕發廠劉東區灣業區實業蘭創黃鐰甪恆 C#轉碼結果:%daS%82m%e6%82%c5R%e2O%b8%f3%bct%95N%cc%96%9ee%98I%85%5e%cc%96%e4k%b0l%8fS%84%a2%96%7c%85%5e%9e%b3%98I%85%5e%8c%8d%98I%ccm%84%93%fcS%e8A%aef%90a Java轉碼結果:%DA%53%82%6D%E6%82%C5%52%E2%4F%B8%F3%BC%74%95%4E%CC%96%9E%65%98%49%85%5E%CC%96%E4%6B%B0%6C%8F%53%84%A2%96%7C%85%5E%9E%B3%98%49%85%5E%8C%8D%98%49%CC%6D%84%93%FC%53%E8%41%AE%66%90%61 對比結果截圖: 找了很久的原因都沒有發現時什么問題,最后查了一下GBK字符的 范圍http://blog.csdn.net/gaoqingyu/article/details/5709958發現JAVA轉出來是正確的,C#轉出來是錯誤的。每個漢子字符轉出GBK應該都睡四個字節碼,C#中有些字轉出來只有三個字符(當然每兩個字符會以%拼接),盯著C#轉出來的字節碼和GBK進行對比,發現C#中最后一個字母有些是大于F的,看到GBK字符集中是沒有最大就到F不可能有什么NMSWZ等這些字母。猜測三個字母中應該最后一個字母是需要轉出16進制的。然會就試著轉了一下,果然和Java的一樣的。以下是C#的代碼:
 1 public static void ConvertURLGBKEnCode() 2         { 3             string str2 = "赟俶鎮臨釵閣紅昇號瀍業區號鋕發廠劉東區灣業區實業蘭創黃鐰甪恆"; 4  5             string str = string.Empty; 6             string urlEnCodeStr = string.Empty; 7             Regex reg = new Regex(@"[/u4e00-/u9fa5]");//正則表達式 8             StringBuilder sb1 = new StringBuilder(); 9             for (int i = 0; i <= str2.Length - 1; i++)10             {11                 string tempStr = str2[i].ToString();12                 urlEnCodeStr = System.Web.HttpUtility.UrlEncode(tempStr, Encoding.GetEncoding("GBK"));13 14                 // 如果是漢子的話,將URL編碼過后再進行16進制轉換15                 if (reg.IsMatch(tempStr))16                 {17                     // 判斷轉碼過后的字符,如果只有4位的話,代表最后一個字符需要轉換成16進制行拼接18                     if (urlEnCodeStr.Length <= 4)19                     {20                         StringBuilder sb = new StringBuilder();21                         string firstStr = urlEnCodeStr.Substring(0, 3);22                         string LastStr = urlEnCodeStr.Substring(3, 1);23                         sb.Append(firstStr + "%");24                         byte[] targetData = Encoding.GetEncoding("GBK").GetBytes(LastStr);25                         for (int j = 0; j < targetData.Length; j++)26                         {27                             sb.Append(targetData[j].ToString("x2"));28                         }29                         sb1.Append(sb.ToString());30                     }31                     else32                     {33                         sb1.Append(urlEnCodeStr);34                     }35                 }36                 else37                 {38                     sb1.Append(urlEnCodeStr);39                 }40             }41 42             Console.WriteLine(sb1.ToString());43 44             Console.ReadLine();45         }
View Code

對于漢字中的生僻字和繁體字問題已經解決了,但是剛剛有跑一下特殊符號又郁悶了。

將上面C#的代碼 :if (reg.IsMatch(tempStr)) 改為 if (urlEnCodeStr.Length > 1) 對于GBK中包含的特殊字符都是可以順利轉換的,但是,不是GBK字符符號的轉換就沒法確認了。

如:符號:“-”

C#轉換結果:“-”; Java:“-”

字符:"("

C# 轉換結果: "(",而Java跑出來的結果卻是"%28",關于這個左括號我查過了,是不屬于GBK中的字符,應該也不算特殊字符,應該是直接顯示的,像字母和數字以及"-"等字符一樣,但就是不知道為什么,Java會轉換成"%28"。

關于這個不是GBK的字符,進行轉換GBK的問題還有待研究。


發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 柯坪县| 巴林右旗| 垣曲县| 兴宁市| 襄樊市| 即墨市| 鹤庆县| 建湖县| 新乐市| 夏津县| 兰溪市| 柘荣县| 德兴市| 宁武县| 龙岩市| 南汇区| 富蕴县| 宜兰县| 山丹县| 县级市| 都匀市| 长葛市| 于都县| 普兰店市| 酒泉市| 高邮市| 吉安县| 新沂市| 德惠市| 永春县| 资溪县| 盘锦市| 新疆| 和政县| 乌兰浩特市| 桓仁| 灵宝市| 上蔡县| 汨罗市| 保康县| 高唐县|