mysql 字符串長度計算實現(xiàn)代碼(gb2312+utf8)

2020-01-19 00:02:44

字體：大中小

供稿：網(wǎng)友

PHP對中文字符串的處理一直困擾于剛剛接觸PHP開發(fā)的新手程序員。下面簡要的剖析一下PHP對中文字符串長度的處理：

PHP自帶的函數(shù)如strlen()、mb_strlen()都是通過計算字符串所占字節(jié)數(shù)來統(tǒng)計字符串長度的，一個英文字符占1字節(jié)。例：

$enStr = 'Hello,China!';
echo strlen($enStr); // 輸出：12

而中文則不然，做中文網(wǎng)站一般會選擇兩種編碼：gbk/gb2312或是utf-8。utf-8能兼容更多的字符，所以受到很多站長的喜愛。gbk與utf-8對中文的編碼不同，導(dǎo)致中文在gbk與utf-8編碼下所占字節(jié)也有差異。

gbk編碼下每個中文字符所占字節(jié)為2，例：

$zhStr = '您好，中國！';
echo strlen($zhStr); // 輸出：12

utf-8編碼下每個中文字符所占字節(jié)為3，例：

$zhStr = '您好，中國！';
echo strlen($zhStr); // 輸出：18

那么如何計算這組中文字符串的長度呢？有人可能會說gbk下獲取中文字符串長度除以2，utf-8編碼下除以3不就行了嗎？但是您要考慮字符串并不老實，99%的情況會以中英混合的情況出現(xiàn)。

這是WordPress中的一段代碼，主要思想就是先用正則將字符串分解為個體單元，然后再計算單元的個數(shù)即字符串的長度，代碼如下（只能處理utf-8編碼下的字符串）：

復(fù)制代碼代碼如下:

 
$zhStr = '您好，中國！'; 
$str = 'Hello,中國！'; 

// 計算中文字符串長度 
function utf8_strlen($string = null) { 
// 將字符串分解為單元 
preg_match_all("/./us", $string, $match); 
// 返回單元個數(shù) 
return count($match[0]); 
} 
echo utf8_strlen($zhStr); // 輸出：6 
echo utf8_strlen($str); // 輸出：9 

utf8_strlen 主站蜘蛛池模板：屏南县| 鞍山市| 饶河县| 沧州市| 得荣县| 锦州市| 平阴县| 昌吉市| 洞头县| 韶山市| 四子王旗| 怀化市| 资兴市| 明光市| 樟树市| 吉首市| 盐边县| 南平市| 和田市| 准格尔旗| 衡东县| 会理县| 新竹县| 林甸县| 长子县| 新巴尔虎右旗| 乐东| 札达县| 略阳县| 根河市| 海安县| 永安市| 太原市| 台南县| 临江市| 白玉县| 遵义市| 永城市| 漯河市| 金溪县| 同仁县|

国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

mysql 字符串長度計算實現(xiàn)代碼(gb2312+utf8)