国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 學院 > 開發設計 > 正文

“.”(十六進制值0x00)是無效的字符解決方案

2019-11-14 13:31:10
字體:
來源:轉載
供稿:網友

     自從我們的項目數據層從讀取數據庫改為讀取接口服務后,經常會出現一些類似于的錯誤。我們的數據結構如下所示

1    <type><![CDATA[gp]]></type> 2           <detail><![CDATA[劉?->->,C#為正則表達式提供了強大的支持,本課程重點講述在C#環境下使用正則表達式,并能夠學會分析創建屬于自己的正則表達式,學習正則表達式請訪問http://edu.51cto.com/course/course_id-4664.html]]></detail> 3   <housepurpose><![CDATA[住宅]]></housepurpose>
接口數據

在用戶輸入的數據中常常有一些小人箭頭之類的特殊符號(由于在www.survivalescaperooms.com/xietong下不支持這些特殊符號,所以讀者在我舉例的數據結構中看不到這些特殊符號),我曾經嘗試匹配這些特殊字符,然而未能找到與之相匹配的unicode代碼區塊,所以采用了匹配正常字符的方式來獲取合法的數據用于xml解析。可以看到我們數據中的字符包括字母數字、各種標點、空白符,據此可以寫出我們的正則表達式"(/w|/p{P}|/s)*"。在RegxTest下測試發現無法匹配“<>=”這些符號,加上這些符號后正則表達式為"(/w|/p{P}|[<>=]|/s)*",經測試,發現可以獲取到所有正常的字符,在c#中代碼如下:

           string content = sb.ToString();            MatchCollection matches = Regex.Matches(content, @"(/w|/p{P}|[<>=]|/s)*");            sb = new StringBuilder();            foreach (Match m in matches)            {                sb.Append(m.Value);            }            content = sb.ToString();

  在運行之后發現類似異常雖然少了很多,但還是有一部分異常,查看這些異常發現造成這些異常的原因正是存在16進制的字符,數據如下:

1  <shinimgs><![CDATA[http://img6n.soufunimg.com/viewimage/agents/2015_08/24/M09/01/12/wKgEUFXaYrSILIxEAAClop_zcLMAABrYAEF2hoAAKW6316/120x120.jpg;http://img7.soufunimg.com/viewimage/agents/2015_08/24/M01/0C/FA/wKgEKlXaYrWIOQbmAACrV5PpfxIAAURwACqFtkAAKtv885/120x120.jpg;http://img7.soufunimg.com/viewimage/agents/2015_08/24/M04/0C/FA/wKgELFXaYrSIVo9xAAB3vv5fpe8AAURuwMY6CsAAHfW851/120x120.jpg;http://img6n.soufunimg.com/viewimage/agents/2015_08/24/M00/01/12/wKgEUFXaYrSIQR6mAABxJ5OYy6AAABrWQPffz0AAHE_808/120x120.jpg]]></shinimgs> 2           <xqimgs><![CDATA[http://img7.soufunimg.com/viewimage/agents/2015_05/11/M08/08/BD/wKgELFVQEdqIFbqUAADuyIgGO48AANp_AOJcvcAAO7g917/120x120.jpg;http://img7.soufunimg.com/viewimage/agents/2015_08/24/M01/0C/FA/wKgEK1XaYrWIaxkaAACwvmucOS8AAURwACqwkgAALDW084/120x120.jpg;http://img7.soufunimg.com/viewimage/agents/2015_07/04/M08/0A/E5/wKgEKlWXSA2IXitfAACu3NyaN_wAARBpgNFzlcAAK70576/120x120.jpg;http://img7.soufunimg.com/viewimage/agents/2015_05/11/M08/08/BD/wKgELFVQEd-IJevUAACSMy8yODUAANp_AOZCjMAAJJL453/120x120.jpg;http://img7.soufunimg.com/viewimage/agents/2015_05/11/M09/08/BD/wKgELFVQEd-ISF5YAADAL5ip7McAANqDAHBU9cAAMBH365/120x120.jpg]]></xqimgs> 
View Code

      如果直接將0x式樣的16進制去掉,那么這些圖片就無法找到正確地址,似乎有些粗魯。為此,我決定將相應的變量先取出來,然后在讀取出來的DataSet中重新對相應字段賦值。我的代碼如下:

 1    MatchCollection imatches = null; 2             if (Regex.IsMatch(content, "0x[0-9a-fA-F]+", RegexOptions.IgnoreCase)) 3             { 4                 Regex regex = new Regex(@"<(?'tag'/w+?)><!/[CDATA/[(?'text'.*?0[Xx].*?)/]/]><//k'tag'>"); 5                 imatches = regex.Matches(content); 6                 if (imatches != null) 7                 { 8                     content = regex.Replace(content, "<${tag}></${tag}>"); 9                 }10             }11 12             System.Xml.XmlDocument xd = new System.Xml.XmlDocument();13             xd.LoadXml(content);14             System.Xml.XmlNodeReader xnr = new System.Xml.XmlNodeReader(xd);15             ds.ReadXml(xnr);16             xnr.Close();17             if (imatches != null && imatches.Count > 0 && ds != null && ds.Tables.Count > 0)18             {19                 foreach (Match m in imatches)20                 {21                     foreach (DataTable table in ds.Tables)22                     {23                         if (table.Columns.Contains(m.Groups["tag"].Value))24                         {25                             table.Rows[0][m.Groups["tag"].Value] = m.Groups["text"].Value;26                             break;27                         }28                     }29                 }30             }

          在上面的代碼中用到了正則的文本替換及分租,如果有不理解的地方可以在http://edu.51cto.com/course/course_id-4664.html中學習一下基本的C#正則表達式知識。

         上面的代碼經測試可以正常運行,但放到那里呢,雖然在try-catch拋出異常,在異常中處理的話要耗費幾百個時鐘周期,但鑒于問題數據只是一小部分,并且上面的正則表達式的效率并不太高,所以我將上面的代碼放在了catch語句塊中。


發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 密云县| 澄江县| 鄂温| 玉树县| 屏南县| 恩平市| 雷波县| 栖霞市| 湘乡市| 蒲江县| 沅江市| 五莲县| 蛟河市| 南涧| 岳普湖县| 报价| 太湖县| 九台市| 于都县| 海盐县| 游戏| 尚义县| 大兴区| 晋江市| 红河县| 陇川县| 纳雍县| 桓仁| 临沧市| 都安| 青河县| 崇信县| 高州市| 朝阳市| 平遥县| 桃源县| 迭部县| 高陵县| 金秀| 迭部县| 龙州县|