在php中如果你想正則來(lái)獲取字符串中漢字我們先需要知道頁(yè)面編碼,正則匹配中文漢字根據(jù)頁(yè)面編碼不同而略有區(qū)別:GBK/GB2312編碼:[x80-xff>]+ 或 [xa1-xff]+ 而UTF-8編碼:[x{4e00}-x{9fa5}]+/u .
實(shí)例代碼如下:
- echo (mb_eregi("[x80-xff].","中d文") ? "有" : "無(wú)") ."漢字";
- echo (mb_eregi("^([x80-xff].)+$","中文") ? "全是漢字" : ""); 看一判斷全中文字符串函數(shù)
以下以PHP為例進(jìn)行匹配:
實(shí)例代碼如下:
- <?php
- $str = "學(xué)習(xí)php是一件快樂(lè)的事.";
- preg_match_all("/[x80-xff]+/", $str, $match);
- //UTF-8 使用:
- //preg_match_all("/[x{4e00}-x{9fa5}]+/u", $str, $match);
- print_r($match);
- ?>
輸出:
- Array
- (
- [0] => Array
- (
- [0] => 學(xué)習(xí)
- [1] => 是一件快樂(lè)的事.
- )
- )
正則漢字實(shí)例代碼如下:
- $str = "請(qǐng)問(wèn)php中的eregi如何匹配漢字";
- if (preg_match("/^[".chr(0x80)."-".chr(0xff)."]+$/",$str)) {
- echo "這是一個(gè)純中文字符串";
- } else{
- echo "這不是一個(gè)純中文字串";
- }
- preg_match_all($pat,……)與preg_replace($pat,……)……
- preg_match_all("/(漢字)+/ism","我是漢字,看你把我怎么著!",$m_a);
各個(gè)編碼的高位與低位的開(kāi)始與結(jié)束,那么自然就可以寫(xiě)出正則,而且直接是十六位的,有啥困難?呵呵.不過(guò)要注意,在php里面,表示十六位是用的x,我們還可以用該正則表達(dá)式來(lái)判斷是否是gb2312的漢字
實(shí)例代碼如下:
- <?php
- $str = "小小子";
- if(preg_match("/^[xb0-xf7][xa0-xfe]+$/",$str)){
- print($str."確實(shí)全是漢字");
- } else {
- print($str."這個(gè)真tc不全是漢字");
- }
- ?>
新聞熱點(diǎn)
疑難解答