3種利用php獲得網(wǎng)頁(yè)源代碼抓取網(wǎng)頁(yè)內(nèi)容的方法,我們可以根據(jù)實(shí)際需要選用。
1、使用file_get_contents獲得網(wǎng)頁(yè)源代碼
這個(gè)方法最常用,只需要兩行代碼即可,非常簡(jiǎn)單方便。
參考代碼:
?php$fh= file_get_contents( http://www.webkaka.com/ echo $fh;?
2、使用fopen獲得網(wǎng)頁(yè)源代碼
這個(gè)方法用的人也不少,不過(guò)代碼有點(diǎn)多。
參考代碼:
?php$fh = fopen( http://www.webkaka.com/ , r if($fh){ while(!feof($fh)) { echo fgets($fh);?
3、使用curl獲得網(wǎng)頁(yè)源代碼
使用curl獲得網(wǎng)頁(yè)源代碼的做法,往往是需要更高要求的人使用,例如當(dāng)你需要在抓取網(wǎng)頁(yè)內(nèi)容的同時(shí),得到網(wǎng)頁(yè)header信息,還有ENCODING編碼的使用,USERAGENT的使用等等。
參考代碼一:
?php// 創(chuàng)建一個(gè)新cURL資源$ch = curl_init();// 設(shè)置URL和相應(yīng)的選項(xiàng)curl_setopt($ch, CURLOPT_URL, http://www.webkaka.com/ curl_setopt($ch, CURLOPT_HEADER, false);// 抓取URL并把它傳遞給瀏覽器$data = curl_exec($ch);echo $data;//關(guān)閉cURL資源,并且釋放系統(tǒng)資源curl_close($ch);?
參考代碼二:
?php$szUrl = http://www.webkaka.com/ $UserAgent = Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0; SLCC1; .NET CLR 2.0.50727; .NET CLR 3.0.04506; .NET CLR 3.5.21022; .NET CLR 1.0.3705; .NET CLR 1.1.4322) $curl = curl_init();curl_setopt($curl, CURLOPT_URL, $szUrl);curl_setopt($curl, CURLOPT_HEADER, 0); //0表示不輸出Header,1表示輸出curl_setopt($curl, CURLOPT_RETURNTRANSFER, 1);curl_setopt($curl, CURLOPT_SSL_VERIFYPEER, false);curl_setopt($curl, CURLOPT_SSL_VERIFYHOST, false);curl_setopt($curl, CURLOPT_ENCODING, curl_setopt($curl, CURLOPT_USERAGENT, $UserAgent);curl_setopt($curl, CURLOPT_FOLLOWLOCATION, 1);$data = curl_exec($curl); echo $data;//echo curl_errno($curl); //返回0時(shí)表示程序執(zhí)行成功 exit();?
以上就是php獲取網(wǎng)頁(yè)內(nèi)容的方法有哪些?php獲取網(wǎng)頁(yè)內(nèi)容的代碼示例的詳細(xì)內(nèi)容,PHP教程
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。
新聞熱點(diǎn)
疑難解答
圖片精選