国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Python > 正文

Python中還原JavaScript的escape函數編碼后字符串的方法

2020-02-23 05:40:48
字體:
來源:轉載
供稿:網友

遇到一個問題需要用Python把JavaScript中escape的中文給還原,但找了大半天,也沒有找到答案,只好自己深入研究解決方案。
我們先來看在js中escape一段文字的編碼
代碼如下:
a = escape('這是一串文字');
alert(a);

輸出:
代碼如下:
%u8FD9%u662F%u4E00%u4E32%u6587%u5B57

咋一看,就感覺有點類似json格式,我們來看看標準的json格式編碼同樣的漢子“這是一串文字”
代碼如下:
# encoding=utf-8
import json
a = '這是一串文字'
print json.dumps(a)

輸出:
代碼如下:"/u8fd9/u662f/u4e00/u4e32/u6587/u5b57"
經過對比,其實就是js escape編碼每個漢子都是“%u”符號加4位字符編碼,而json編碼每個漢子都是“/u”符號加4位字符編碼,這樣的話,我們可以利用字符串替換操作還原json格式,然后再使用json模塊loads就好
代碼如下:
# encoding=utf-8
import json
 
# js escape 字符串編碼
c = '%u8FD9%u662F%u4E00%u4E32%u6587%u5B57'
 
# 還原Json對象
jsonObj =  '"'+"".join([(i and "http://"+i) for i in c.split('%')])+'"'
 
print json.loads(jsonObj)

特別記得在把“%”替換為“/”符號以后還要再使用雙引號把字符串包一下,才能算是一個json對象,然后才能json.loads出來
后來,好不容易在一個站點上看到了更簡便的方法。代碼如下:
代碼如下:
# encoding=utf-8
c = '%u8FD9%u662F%u4E00%u4E32%u6587%u5B57'
print "".join([(len(i)>0 and unichr(int(i,16)) or "") for i in c.split('%u')])

它的思路其實都差不多,把“%u”號替換掉,剩下每一個都是4位固定長度的字符編碼,最后在unichr反編碼回中文字符。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 江川县| 平武县| 土默特右旗| 依安县| 平阳县| 九寨沟县| 炎陵县| 大同市| 怀宁县| 永新县| 会理县| 汨罗市| 缙云县| 洛浦县| 皮山县| 且末县| 卢氏县| 荥阳市| 红河县| 凉城县| 长宁县| 哈尔滨市| 襄城县| 永川市| 荔波县| 顺义区| 武宣县| 恩施市| 砚山县| 阿拉善右旗| 遂川县| 大同县| 区。| 莱州市| 呼和浩特市| 崇文区| 汝南县| 福海县| 乌拉特后旗| 泰来县| 旌德县|