国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 開發 > PHP > 正文

分割GBK中文遭遇亂碼的解決方法

2024-05-04 23:12:30
字體:
來源:轉載
供稿:網友

類似如下的字符串(GBK), explode不能得到正確結果:

1.$result = explode("|", "滕華弢|海青"); 究其原因, 對于”弢”字(讀tao,不認識沒關系,我也不認識), 因為他的GBK編碼值為: 8f7c, 不巧的是, “|”的ASCII值也是7c.

這樣的問題, 還有很多 : 因為GBK編碼的編碼范圍是: 0×8140-0xfefe, 所以, 理論上來說, 任何低字節是7c的字都會有這個問題, 比如:

1.倈(827c), 億(837c), 眧(b17c), 鍇(e57c).......等等等等對于這樣的情況,

1.第一, 可以采用轉碼到utf8, 然后explode, 再轉回來, 這是比較麻煩的方法.
2.第二, 我們可以采用正則拿"匹配出"來代替"分離出":
3.preg_match_all("/([/x81-/xfe][/x40-/xfe])+/", $gbk_str, $matches);//寫死編碼這樣, $matches中0號索引對應的數組就是結果詞的數組了..

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 金溪县| 鸡东县| 宝丰县| 越西县| 高碑店市| 峨眉山市| 和静县| 民县| 威海市| 七台河市| 廊坊市| 香港 | 玉树县| 油尖旺区| 崇信县| 安徽省| 巴林右旗| 津南区| 永泰县| 邯郸县| 临沂市| 思南县| 子长县| 德兴市| 南陵县| 宣威市| 纳雍县| 自治县| 新巴尔虎左旗| 左云县| 临城县| 美姑县| 洱源县| 龙山县| 从化市| 玉门市| 汉阴县| 阿荣旗| 驻马店市| 陇西县| 筠连县|