国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 開發 > PHP > 正文

PHP正確解析UTF-8字符串技巧應用

2024-05-04 23:13:30
字體:
來源:轉載
供稿:網友
在《學習PHP&MYSQL之——字符編碼篇(一)》中介紹了Unicode與UTF-8的轉換關系,總結了一個UTF-8的編碼規則,根據這個編碼規則,寫一個UTF-8編碼的解析程序,以下是PHP的實現:

復制代碼 代碼如下:


<?php
/*
程序功能,$str是中英文混合的UTF-8編碼字符串,
將此字符串根據UTF-8的編碼規則正確的解碼并顯示。
*/


$str = '今天非常Happy,所有決定去KFC吃可樂雞翅!!!';

/*
$str 是待截取的字符串
$len 是截取的字符數
*/
function utf8sub($str,$len) {
if($len <= 0){
return '';
}

$offset = 0; // 截取高位字節時的偏移量
$chars = 0; // 截取到的字符數
$res = ''; // 存放截取的結果字符串

while($chars < $len){
// 先取字符串的第一個字節
// 將它轉為十進制
// 再轉為二進制
$high = ord(substr($str,$offset,1));

// echo '$high='. $high .'<br />';

if($high == null ){ // 如果取出高位為null,證明已經取到末尾,直接break
break;
}
if(($high>>2) === 0x3F){ // 將高位右移2位,和二進制111111比較,相同則取6個字節
// 截取2個字節
$count = 6;
}else if(($high>>3) === 0x1F){ // 將高位右移2位,和二進制11111比較,相同則取5個字節
// 截取3個字節
$count = 5;
}else if(($high>>4) === 0xF){ // 將高位右移2位,和二進制1111比較,相同則取4個字節

// 截取4個字節
$count = 4;
}else if(($high>>5) === 0x7){ // 將高位右移2位,和二進制111比較,相同則取3個字節

// 截取5個字節
$count = 3;
}else if(($high>>6) === 0x3){ // 將高位右移2位,和二進制11比較,相同則取2個字節
// 截取6個字節
$count = 2;
}else if(($high>>7) === 0x0){ // 將高位右移2位,和二進制0比較,相同則取1個字節
$count = 1;
}
// echo '$count='.$count.'<br />';

$res .= substr($str,$offset,$count); // 取出一個字符與$res字符串連接
$chars += 1; // 截取到的字符數+1
$offset += $count; // 截取高位偏移量向后移$count字節
}
return $res;
}

echo utf8sub($str,100);

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 岳池县| 新闻| 丽水市| 广东省| 乳源| 泾川县| 深圳市| 鄂托克旗| 丰宁| 玛沁县| 光泽县| 日喀则市| 和林格尔县| 读书| 左权县| 大城县| 江油市| 姚安县| 台中县| 台北市| 秀山| 墨竹工卡县| 赤城县| 金阳县| 九龙县| 东安县| 莲花县| 合水县| 奉新县| 新巴尔虎左旗| 赣州市| 曲靖市| 玛多县| 吉木乃县| 仙桃市| 缙云县| 呈贡县| 新源县| 阳山县| 漳浦县| 黎城县|