国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > HTML > 正文

html中關于charset的語言編碼詳解

2020-03-24 19:17:24
字體:
來源:轉載
供稿:網友
注意HTML的語言編碼的重要性

目錄


charset編碼重要性

charset在html什么地方

charset標簽

編碼種類

charset utf-8介紹

charset GB2312介紹

推薦網頁編碼

因編碼導致網頁兼容

一、編碼重要性 - TOP

編碼可導致瀏覽者通過IE時候網頁亂碼,也可導致p+css的兼容性Hack。

二、編碼的位置 - TOP三、html編碼樣式 - TOP
 meta http-equiv= Content-Type content= text/html; charset=utf-8 / 


通過改變charset=utf-8中的utf-8就可以改變網頁的編碼。
一般我們在寫CSS文件時候也需要在CSS文件頂部使用@charset utf-8 來定義此CSS文件編碼類型。一般html源代碼和css文件編碼要統一,如果不統一會導致CSS hack,頁面亂碼網頁頁面排版亂等兼容問題。

四、常用html編碼種類 - TOP

國內常用的流行的有utf-8、gb2312這兩種。一般這兩種類型就能滿足國內網頁編碼需求。當然程序和數據庫中也會用到這兩種編碼類型來處理網頁和存儲數據類型。

五、UTF-8 有一下特性: - TOP

UCS 字符 U+0000 到 U+007F (ASCII) 被編碼為字節 0x00 到 0x7F (ASCII 兼容). 這意味著只包含 7 位 ASCII 字符的文件在 ASCII 和 UTF-8 兩種編碼方式下是一樣的.

所有 U+007F 的 UCS 字符被編碼為一個多個字節的串, 每個字節都有標記位集. 因此, ASCII 字節 (0x00-0x7F) 不可能作為任何其他字符的一部分.

表示非 ASCII 字符的多字節串的第一個字節總是在 0xC0 到 0xFD 的范圍里, 并指出這個字符包含多少個字節. 多字節串的其余字節都在 0x80 到 0xBF 范圍里. 這使得重新同步非常容易, 并使編碼無國界, 且很少受丟失字節的影響.

可以編入所有可能的 231個 UCS 代碼

UTF-8 編碼字符理論上可以最多到 6 個字節長, 然而 16 位 BMP 字符最多只用到 3 字節長.

Bigendian UCS-4 字節串的排列順序是預定的.

字節 0xFE 和 0xFF 在 UTF-8 編碼中從未用到.

六、GB2312 有以下特性 - TOP

GB2312標準共收錄6763個漢字,其中一級漢字3755個,二級漢字3008個;同時,GB2312收錄了包括拉丁字母、希臘字母、日文平假名及片假名字母、俄羅斯語西里爾字母在內的682個全形字符。

GB2312的出現,基本滿足了漢字的計算機處理需要,它所收錄的漢字已經覆蓋99.75%的使用頻率。GB2312中對所收漢字進行了“分區”處理,每區含有94個漢字/符號。這種表示方式也稱為區位碼。

01-09區為特殊符號。

16-55區為一級漢字,按拼音排序。

56-87區為二級漢字,按部首/筆畫排序。

10-15區及88-94區則未有編碼。

舉例來說,“啊”字是GB2312之中的第一個漢字,它的區位碼就是1601。字節結構在使用GB2312的程序中,通常采用EUC儲存方法,以便兼容于ASCII。每個漢字及符號以兩個字節來表示。第一個字節稱為“高位字節”,第二個字節稱為“低位字節”。 “高位字節”使用了0xA1-0xF7(把01-87區的區號加上0xA0),“低位字節”使用了0xA1-0xFE(把01-94加上0xA0)。例如“啊”字在大多數程序中,會以0xB0A1儲存。(與區位碼對比:0xB0=0xA0+16,0xA1=0xA0+1)。

所以GB2312編碼中漢字區碼的十進制是從176到247,位碼是從161到255.之所以存儲了6763小于82*94=6768,是因為在區碼為215,位碼為250-254之間共五個編碼沒有漢字編碼,所以6768-5=6763個。

GB2312編碼可以通俗理解為國內通用的語言。

七、推薦charset使用編碼 - TOP

UTF-8可以通俗理解簡體繁體可用此編碼如臺灣和內地使用此編碼。

八、因編碼導致網頁兼容錯誤問題: - TOP

如果編碼混排將使網頁亂碼也叫不兼容,特別是在CSS注釋中使用了編碼混排將導致css hack。

希望以后在制作網頁的時候千萬不要忘記對網頁編碼的聲明。

瀏覽過此頁用戶還瀏覽以下內容:
1、UTF-8 GBK UTF8 GB2312之間的區別和關系
2、html編碼如何選擇
3、html編碼設置

以上就是html中關于charset的語言編碼詳解的詳細內容,html教程

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 崇州市| 湄潭县| 常山县| 明溪县| 平潭县| 甘孜县| 寿阳县| 沛县| 布拖县| 商城县| 若尔盖县| 甘洛县| 绥芬河市| 郎溪县| 乌兰察布市| 辰溪县| 招远市| 新源县| 东源县| 财经| 黑河市| 古蔺县| 苗栗县| 彩票| 奇台县| 勃利县| 灵宝市| 肥东县| 西林县| 黄石市| 凤阳县| 新营市| 越西县| 安溪县| 德令哈市| 郧西县| 东兰县| 阿合奇县| 巴里| 新平| 商城县|