今天寫代碼時(shí)遇到一個(gè)中文字符串截取的問題,原來簡單的想直接用substr()來,但這個(gè)是在單字節(jié)符下用的,對于多字節(jié)編碼的漢字或是其它語言字符中,這個(gè)函數(shù)就不能能用了,容易截出亂碼來!
現(xiàn)在做下工作記錄和總結(jié)分享:
問題產(chǎn)生及使用案例網(wǎng)站:天氣預(yù)報(bào)15天查詢(http://tqybw.net)
問題時(shí)間:2013-10-20
解決思路:把漢字按一個(gè)漢字在編碼下按其在完整性正則分割成數(shù)組,再根據(jù)需要取截取長度;
1、實(shí)現(xiàn)方法函數(shù)
開啟mbstring擴(kuò)展,然后自定義函數(shù):
<?php header('content-Type:text/html:charset=utf-8'); function substr_chinese($str, $start, $length = null) { return join("", array_slice( preg_split("//u", $str, -1, PREG_SPLIT_NO_EMPTY), $start, $length) ); } //實(shí)例 $str = "中國地圖全圖"; echo substr_utf8($str, 0, 4); //輸出: 中國地圖 ?>
2、主要函數(shù)功能說明preg_split:
對于初學(xué)者來說,大家對 說明 array preg_split ( string $pattern, string $subject [, int $limit [, int $flags]] )
返回一個(gè)數(shù)組,包含 subject 中沿著與 pattern 匹配的邊界所分割的子串。
如果指定了 limit,則最多返回 limit 個(gè)子串,如果 limit 是 -1,則意味著沒有限制,可以用來繼續(xù)指定可選參數(shù) flags。
flags 可以是下列標(biāo)記的任意組合(用按位或運(yùn)算符 | 組合):
PREG_SPLIT_NO_EMPTY
如果設(shè)定了本標(biāo)記,則 preg_split() 只返回非空的成分。
PREG_SPLIT_DELIM_CAPTURE
如果設(shè)定了本標(biāo)記,定界符模式中的括號表達(dá)式也會被捕獲并返回。本標(biāo)記添加于 PHP 4.0.5。
PREG_SPLIT_OFFSET_CAPTURE
如果設(shè)定了本標(biāo)記,如果設(shè)定本標(biāo)記,對每個(gè)出現(xiàn)的匹配結(jié)果也同時(shí)返回其附屬的字符串偏移量。注意這改變了返回的數(shù)組的值,使其中的每個(gè)單元也是一個(gè)數(shù)組,其中第一項(xiàng)為匹配字符串,第二項(xiàng)為其在 subject 中的偏移量。本標(biāo)記自 PHP 4.3.0 起可用。
提示
如果不需要正則表達(dá)式的功能,可以選擇使用更快(也更簡單)的替代函數(shù)如 explode() 或 str_split()。
3、array_slice說明:
array_slice() 函數(shù)在數(shù)組中根據(jù)條件取出一段值,并返回。
<?php $a=array(0=>"Dog",1=>"Cat",2=>"Horse",3=>"Bird"); print_r(array_slice($a,1,2)); ?> 輸出:Array ( [0] => Cat [1] => Horse )PHP編程
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。
新聞熱點(diǎn)
疑難解答
圖片精選