国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 學(xué)院 > 開發(fā)設(shè)計(jì) > 正文

ASP.NET網(wǎng)頁抓取數(shù)據(jù)

2019-11-17 02:12:22
字體:
供稿:網(wǎng)友

asp.net網(wǎng)頁抓取數(shù)據(jù)

我的數(shù)據(jù)通過一個(gè)TextBox輸入,這些代碼是寫在一個(gè)button的點(diǎn)擊事件里的。

網(wǎng)頁數(shù)據(jù)抓取大概分為兩步,第一步是獲取網(wǎng)頁源代碼:

具體注釋如下:

var currentUrl = TextBox1.Text;//獲得要抓取的網(wǎng)頁的URL地址 var request = WebRequest.Create(currentUrl) as HttpWebRequest;//請(qǐng)求對(duì)象 var response=request.GetResponse()as HttpWebResponse;//定義頁面回應(yīng)對(duì)象

var encode = string.Empty; encode = response.CharacterSet;//獲得網(wǎng)頁的編碼

Stream stream;//數(shù)據(jù)流 if (response.ContentEncoding.ToLower() == "gzPRessionMode.Decompress); } else { stream = response.GetResponseStream(); }//解壓縮 var sr = new StreamReader(stream,Encoding.GetEncoding(encode));//定義數(shù)據(jù)流讀取對(duì)象 var html = sr.ReadToEnd(); sr.Close(); HtmlDocument document=new HtmlDocument(); document.LoaDHTML(html);//將數(shù)據(jù)存入document

得到了網(wǎng)頁源代碼,接下來就是對(duì)其解析,就是第二步:

解析可以使用正則表達(dá)式或是Spilt等字符串操作方法。

根據(jù)源代碼寫出的Xpath,利用節(jié)點(diǎn)得到位于兩個(gè)節(jié)點(diǎn)之間的數(shù)據(jù):

我的對(duì)象網(wǎng)頁就是我的博客主頁http://home.VEVb.com/u/xuwanghu/

string sumLine = document.DocumentNode.SelectSingleNode("http://body//ul[@id='user_profile']").InnerText;

string yuanlin = sumLine2.ToString().Split(':')[0].Split('博')[0];

這樣子,就將園齡存入了yuanlin,也就實(shí)現(xiàn)了抓取網(wǎng)頁數(shù)據(jù)的功能。


發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 聂拉木县| 齐齐哈尔市| 增城市| 安化县| 仙桃市| 崇左市| 饶阳县| 雷山县| 黄平县| 竹山县| 馆陶县| 南靖县| 岫岩| 定结县| 凤凰县| 宁国市| 澜沧| 靖安县| 略阳县| 青冈县| 鄄城县| 延川县| 正镶白旗| 恩平市| 潮州市| 湘潭县| 揭阳市| 邳州市| 灵璧县| 台中县| 读书| 西宁市| 尉氏县| 化德县| 万源市| 根河市| 阿拉善盟| 巴彦淖尔市| 佳木斯市| 青浦区| 元阳县|