国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 開發 > PHP > 正文

php file_get_contents 設置代理抓取頁面示例

2024-05-04 21:48:01
字體:
來源:轉載
供稿:網友

file_get_contents函數在php中可以直接打開本地文件也可以直接抓取遠程服務器文件,如果簡單的采集我們可以使用file_get_contents直接來操作,如果有防采集我們可能需要代理來操作,下面我來介紹file_get_contents抓取頁面示例.

例1,普通頁面獲取

例如,訪問54master論壇,想抓取首頁里 所有h3標記內的元素,代碼如下:

  1. $url=http://www.survivalescaperooms.com; 
  2. $contents=@file_get_contents($url); 
  3. //preg_match_all("/<p class="right forumcount">(.*?)</p>/is",$contents,$content); 
  4. preg_match_all("/<h3>(.*?)</h3>/is",$contents,$content); 
  5. print_r($content[0]); 

例2,設置代碼IP去采集數據

使用file_get_contents 和 stream_context_create 即可,代碼如下:

  1. $aContext = array(  
  2.     'http' => array(  
  3.         'proxy' => 'tcp://192.168.0.2:3128',  //這里設置你要使用的代理ip及端口號  
  4.         'request_fulluri' => true,  
  5.     ),  
  6. );  
  7. $cxContext = stream_context_create($aContext);  
  8. $sFile = file_get_contents("http://www.survivalescaperooms.com", False, $cxContext);  
  9. echo $sFile

以上代碼適用于正常情況,但是如果目標頁面需要登錄或需要認證信息才能訪問的話,可以加多一句代碼,代碼如下:

  1. $auth = base64_encode('LOGIN:PASSWORD');//LOGIN:PASSWORD 這里是你的賬戶名及密碼  
  2. $aContext = array(  
  3.     'http' => array(  
  4.         'proxy' => 'tcp://192.168.0.2:3128',//這里設置你要使用的代理ip及端口號  
  5.         'request_fulluri' => true,  
  6.         'header' => "Proxy-Authorization: Basic $auth",  
  7.     ),  
  8. );  
  9. $cxContext = stream_context_create($aContext);  
  10. $sFile = file_get_contents(http://www.survivalescaperooms.com, False, $cxContext);  
  11. echo $sFile

這樣就可以使用代理來抓取頁面或文件了.

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 洪雅县| 巩义市| 石楼县| 色达县| 安顺市| 辰溪县| 益阳市| 绿春县| 南投市| 独山县| 长阳| 图们市| 和平县| 南郑县| 乌苏市| 沂南县| 桃园市| 揭东县| 项城市| 大宁县| 新邵县| 石楼县| 安多县| 金坛市| 北辰区| 当涂县| 将乐县| 保亭| 玉屏| 沁阳市| 横峰县| 苍梧县| 上虞市| 台中县| 监利县| 临潭县| 沽源县| 绍兴县| 克东县| 东港市| 万山特区|