国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > PHP > 正文

-phpQuery采集出現(xiàn)亂碼

2020-03-22 18:45:30
字體:
供稿:網(wǎng)友
在線等-phpQuery采集出現(xiàn)亂碼
關(guān)于采集電影天堂出現(xiàn)亂碼,求高手幫處理。。。。。。。。

header("Content-type: text/html; charset=utf-8");
set_time_limit(0);
require_once("../phpQuery/phpQuery.php");

function shootCodeBug($data){
$data=mb_convert_encoding($data,'ISO-8859-1','gb2312');
return mb_convert_encoding($data,'utf-8','GBK');
}

phpQuery::newDocumentHTML(shootCodeBug('http://www.dytt8.net/'));
phpQuery::$defaultCharset="gb2312";
$content = pq("#menu")->html();
phpQuery::$documents=array(); //清空緩存
------解決思路----------------------
這是你的使用方法不當(dāng)造成的
phpQuery 是利用 DOMDocument 做 HTML 解析的
而 DOMDocument::loadHTML 方法在載入 HTML 數(shù)據(jù)時,會根據(jù)文檔中的 標(biāo)記來識別文檔的字符集。
如果文檔中沒有這個標(biāo)記,則取默認(rèn)字符集 ISO-8859-1

因此,如果待處理的內(nèi)容沒有字符集聲明標(biāo)記時,應(yīng)自己附加上去
設(shè) $html 為待分析的內(nèi)容,則
if(! preg_match('/]+charset=/i', $html)) {
$charset = mb_check_encoding($html, 'utf-8') ? 'utf-8' : 'gbk';
$html = sprintf('%s', $charset, $html);
}
再給 phpQuery 處理就沒有問題了

當(dāng)然,你也可以整體的轉(zhuǎn)換成 utf-8 編碼的

鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請第一時間聯(lián)系我們修改或刪除,多謝。

發(fā)表評論 共有條評論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 荣成市| 搜索| 平南县| 噶尔县| 阿城市| 洪雅县| 右玉县| 长春市| 安西县| 柘荣县| 阿拉善右旗| 特克斯县| 武宁县| 剑阁县| 威海市| 瑞金市| 宁阳县| 准格尔旗| 彭州市| 金门县| 遂溪县| 城口县| 渑池县| 齐河县| 恩施市| 喜德县| 会东县| 沙坪坝区| 浑源县| 自贡市| 九台市| 阿荣旗| 晋城| 绩溪县| 余庆县| 泌阳县| 藁城市| 金沙县| 楚雄市| 延安市| 台州市|