之前一直在關(guān)注句子迷這個(gè)網(wǎng)站,在里面可以找到自己喜歡的名人的金典語錄。 每一次都去打開,再去翻頁查看太煩,有沒有什么方法可以把網(wǎng)站中的句子直接抓出來,保存到本地txt文件中? 然后在網(wǎng)上查看了一些資料,自己動(dòng)手寫了一個(gè)控制臺(tái)應(yīng)用程序。
步驟1:通過HttpWebResponse發(fā)送一個(gè)請(qǐng)求,將整個(gè)HTML頁面請(qǐng)求過來,將全部數(shù)據(jù)讀入StreamReader中,下圖html代碼 步驟2:將讀入流中的數(shù)據(jù)進(jìn)行處理,只取包含句子的文本,這里面需要查詢頁面的中html。
在取文本的過程中,使用正則表達(dá)式,取出想要的數(shù)據(jù)
步驟3:對(duì)上面的標(biāo)簽,在進(jìn)一步進(jìn)行提取
Regex objRegExp = new Regex("<(.|/n)+?>");本地保存路徑,及打開文件效果:
新聞熱點(diǎn)
疑難解答
圖片精選
網(wǎng)友關(guān)注