前言
在Python中提供了json包來方便快捷的解析json字串的轉換過程,但是碰到了一個比較奇怪的問題,就是不太正確的json串如何來解析?
1. 問題的提出
今天在處理一個http請求的響應json之時,基于python進行解析,碰到了如下錯誤:
Traceback (most recent call last): File "<ipython-input-16-bff463ed9408>", line 1, in <module> json.loads(r.text) File "/Users/tonychen/anaconda2/lib/python2.7/json/__init__.py", line 339, in loads return _default_decoder.decode(s) File "/Users/tonychen/anaconda2/lib/python2.7/json/decoder.py", line 364, in decode obj, end = self.raw_decode(s, idx=_w(s, 0).end()) File "/Users/tonychen/anaconda2/lib/python2.7/json/decoder.py", line 380, in raw_decode obj, end = self.scan_once(s, idx) ValueError: Expecting property name enclosed in double quotes: line 1 column 2 (char 1)
看來是解析json的時候出錯了....
代碼如下:
import json import requests  user_agent = "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; AcooBrowser; .NET CLR 1.1.4322; .NET CLR 2.0.50727)" def get_header():  return {   'User-Agent': user_agent,   'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8',   'Accept-Language': 'en-US,en;q=0.5',   'Connection': 'keep-alive',   'Accept-Encoding': 'gzip, deflate',  } TEST_URL = 'http://ip.chinaz.com/getip.aspx'  r = requests.get(url=TEST_URL, headers=get_header(), timeout=5) jsonstr = json.loads(r.text)  print(jsonstr) 報錯的代碼行: json.loads(r.text)
那問題出在哪里呢?
2. 問題的分析
讓我們先來看看,r.text中的信息是什么吧:
 >> r.text
u"{ip:'103.47.146.9',address:'/u4e9a/u592a/u5730/u533a '}" 仔細觀察之后,發現其實應該是ip,address的字段沒有相應的引號來包裝,所以json無法正確的進行字符串的處理
那正確的json串格式應該是什么樣子呢?我們來做個樣例看一下
   >> json1 = {'key1': 'val1', 'key2':'val2'}
   >> json.dumps(json1)
'{"key2": "val2", "key1": "val1"}' 正如我們在上文中提到的問題,應該是key沒有正確的被括起來。
3. 問題的解決
知道問題出在哪里之后,我們就可以針對性地進行解決了。問題的解決思路有兩條:
a. 針對字符串來進行處理,保證字符串符合json的格式要求
b. 借助第三方包的幫助順利解決這個問題
相比而言,方案b可以簡便和易用,我們這里使用了demjson的包來處理這個問題。
安裝: pip install demjson            
新聞熱點
疑難解答