国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 網站 > 建站經驗 > 正文

PHP讀取漢字的點陣數據

2024-04-25 20:37:37
字體:
來源:轉載
供稿:網友

項目中遇到的問題:

PHP如何讀取漢字的點陣數據?想實現輸入一段文字,能得到這一段文字的所有點陣碼。

解決方法:

簡體中文國標字庫7445個字符,其中漢字6773個,包括一級漢字3755個,二級漢字3008個。采用2字節(16位二進制)編碼。

區位碼:國標GB2312規定,所有的國標漢字與符號組成一個94×94的矩陣。在此方陣中,每一行稱為一個”區”,每一列稱為一個”位”,因此,這個方陣實際上組成了一個有94個區(區號分別為0 1到94)、每個區內有94個位(位號分別為01到94)的漢字字符集。一個漢字所在的區號和位號簡單地組合在一起就構成了該漢字的”區位碼”。在漢字的區位碼中,高兩位為區號,低兩位為位號。由此可見,區位碼與漢字或符號之間是一一對應的。

內碼:漢字的內碼是指在計算機中表示漢字的編碼。機內碼與區位碼稍有區別。目前,對于國內大多數的計算機系統,一個漢字的內碼占兩個字節,分別稱為高位字節與低位字節,且這兩位字節與區位碼的關系如下: 內碼高位=區碼+A0H(H表示十六進制) 內碼低位=位碼+A0H 例如,漢字”啊”的區位碼為”1601″,區碼和位碼分別用十六進制表示即為”1001H”,則它的內碼為”B0A1H”。其中B0H為內碼的高位字節,A1H為內碼的低位字節。

返回由0和1組成的字符串<?php

/**

* 讀取漢字點陣數據

*

*/

$str = "中華人民共和國";

$font_file_name = "simsun12.fon"; // 點陣字庫文件名

$font_width = 12; // 單字寬度

$font_height = 12; // 單字高度

$start_offset = 0; // 偏移

$fp = fopen($font_file_name, "rb");

$offset_size = $font_width * $font_height / 8;

$string_size = $font_width * $font_height;

$dot_string = "";

for ($i = 0; $i < strlen($str); $i ++)

{

if (ord($str{$i}) > 160)

{

// 先求區位碼,然后再計算其在區位碼二維表中的位置,進而得出此字符在文件中的偏移

$offset = ((ord($str{$i}) - 0xa1) * 94 + ord($str{$i + 1}) - 0xa1) * $offset_size;

$i ++;

}

else

{

$offset = (ord($str{$i}) + 156 - 1) * $offset_size;

}

// 讀取其點陣數據

fseek($fp, $start_offset + $offset, SEEK_SET);

$bindot = fread($fp, $offset_size);

for ($j = 0; $j < $offset_size; $j ++)

{

// 將二進制點陣數據轉化為字符串

$dot_string .= sprintf("%08b", ord($bindot{$j}));

}

}

fclose($fp);

echo $dot_string;

?>

以上所述就是本文的全部內容了,希望大家能夠喜歡。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 安丘市| 景东| 黑龙江省| 永定县| 兰州市| 库车县| 封丘县| 通州区| 武汉市| 元江| 许昌市| 玛沁县| 水城县| 仁怀市| 巨鹿县| 交口县| 海原县| 桦甸市| 哈密市| 孟津县| 土默特左旗| 高雄市| 吉水县| 富川| 襄樊市| 班戈县| 桐城市| 桐梓县| 汉中市| 怀柔区| 印江| 静海县| 安溪县| 三门县| 高邑县| 卫辉市| 当阳市| 商水县| 高要市| 霸州市| 磐石市|