国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > C# > 正文

c#使用nsoup解析html亂碼解決方法分享 nsoup教程

2020-01-24 02:54:35
字體:
來源:轉載
供稿:網友

下載地址:http://nsoup.codeplex.com/

簡單用法如下:

復制代碼 代碼如下:

NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(HtmlString);

處理網絡上的頁面:

復制代碼 代碼如下:

NSoup.Nodes.Document doc = NSoup.NSoupClient.Connect("http://www.survivalescaperooms.com/").Get();

但是遺憾的是NSoup默認的編碼是UTF-8,處理中文有亂碼(對于編碼是UTF-8的自然不會有亂碼,但是有些GB2312的就可能有亂碼,謝謝 forhells的提醒)。

目前我找到兩種解決辦法:

1.下載網頁源代碼再處理

復制代碼 代碼如下:

WebClient webClient = new WebClient();
String HtmlString=Encoding.GetEncoding("utf-8").GetString(webClient.DownloadData("http://www.survivalescaperooms.com"));
NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(HtmlString);

2.獲得網頁的流

復制代碼 代碼如下:

WebRequest webRequest=WebRequest.Create("http://www.survivalescaperooms.com");
NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(webRequest.GetResponse().GetResponseStream(),"utf-8");

第二種用著比較方便,但是我覺得第一種比較合適,畢竟NSoup是個Html解析類,下載網頁代碼這種事情本來不應該交給它。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 湘阴县| 伊宁县| 磐石市| 若尔盖县| 益阳市| 吐鲁番市| 阳东县| 恩施市| 池州市| 淮南市| 遵义市| SHOW| 抚顺市| 揭西县| 湟源县| 馆陶县| 安图县| 浑源县| 长治市| 定边县| 潜江市| 定州市| 昭觉县| 海丰县| 怀宁县| 鄂伦春自治旗| 兰西县| 叶城县| 永丰县| 米泉市| 额尔古纳市| 通州区| 哈巴河县| 宁国市| 大安市| 兴和县| 辽源市| 民县| 阿拉尔市| 浠水县| 玉树县|