要采集一個網站,目標站采用了gzip壓縮傳輸網頁,本來應該只要發送一個http頭 accept-encoding: identity或者干脆不發送這個頭等,就可以使目標站返回沒有經過gzip壓縮的頁面了,不過很不幸,目標站無視客戶端的請求,仍然返回gzip數據,造成亂碼。
其實php對gzip解壓很簡單,用內置的gzdecode函數就可以了,不過很可惜我配置了半天也無法支持gzdecode函數,所以只好變通一下:
以下為引用的內容: if (!function_exists('gzdecode')) { |
調用方法很簡單:
以下為引用的內容: $[email protected]_get_contents("http://www.itlearner.com"); |
商業源碼熱門下載www.html.org.cn
新聞熱點
疑難解答