国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > .NET > 正文

提取HTML代碼中文字的C#函數

2024-07-10 12:40:41
字體:
來源:轉載
供稿:網友

/// <summary>
  /// 去除HTML標記
  /// </summary>
  /// <param name="strHtml">包括HTML的源碼 </param>
  /// <returns>已經去除后的文字</returns>
  public static string StripHTML(string strHtml)
  {
   string [] aryReg ={
          @"<script[^>]*?>.*?</script>",

          @"<(///s*)?!?((/w+:)?/w+)(/w+(/s*=?/s*(([""'])(//[""'tbnr]|[^/7])*?/7|/w+)|.{0})|/s)*?(///s*)?>",
          @"([/r/n])[/s]+",
          @"&(quot|#34);",
          @"&(amp|#38);",
          @"&(lt|#60);",
          @"&(gt|#62);",
          @"&(nbsp|#160);",
          @"&(iexcl|#161);",
          @"&(cent|#162);",
          @"&(pound|#163);",
          @"&(copy|#169);",
          @"&#(/d+);",
          @"-->",
          @"<!--.*/n"

         };

   string [] aryRep = {
           "",
           "",
           "",
           "/"",
           "&",
           "<",
           ">",
           " ",
           "/xa1",//chr(161),
           "/xa2",//chr(162),
           "/xa3",//chr(163),
           "/xa9",//chr(169),
           "",
           "/r/n",
           ""
          };

   string newReg =aryReg[0];
   string strOutput=strHtml;
   for(int i = 0;i<aryReg.Length;i++)
   {
    Regex regex = new Regex(aryReg[i],RegexOptions.IgnoreCase );

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 苍溪县| 宁南县| 深州市| 张家界市| 从江县| 双牌县| 普格县| 磐安县| 福贡县| 奎屯市| 五台县| 汽车| 遵义县| 安西县| 涟源市| 五峰| 鹤庆县| 霞浦县| 荣昌县| 浮梁县| 旬邑县| 安徽省| 涪陵区| 柏乡县| 诸暨市| 五华县| 正定县| 锡林浩特市| 泰宁县| 岢岚县| 台江县| 汝南县| 永定县| 镇赉县| 门头沟区| 巴南区| 湘潭市| 榆社县| 宿松县| 厦门市| 长兴县|