国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁(yè) > 開(kāi)發(fā) > PHP > 正文

php html解析器Simple HTML Dom使用說(shuō)明

2024-05-04 21:48:03
字體:
來(lái)源:轉(zhuǎn)載
供稿:網(wǎng)友

1. 開(kāi)始使用

首先下載解壓縮,然后將simple_html_dom.php文件包含進(jìn)要編寫的腳本文件中,加載要處理的html,支持三種模式的html加載,分別是『從url中加載,從字符串中加載,從文件中加載』.代碼如下:

  1. require_once('simple_html_dom.php'); 
  2. //從url加載 
  3. $html = file_get_html('http://www.survivalescaperooms.com'); 
  4. //從字符串加載 
  5. $html = str_get_html('<html><body>Hello World!</body></html>'); 
  6. //從文件中加載 
  7. $html = file_get_html('example.htm');  
  8. 從字符串加載網(wǎng)上文件需要先從網(wǎng)絡(luò)下下載,使用cURL比較好一些,需要在php配置文件中打開(kāi)php擴(kuò)展php_curl。 
  9.  
  10. $url = 'http://www.survivalescaperooms.com'
  11. $ci = curl_init(); 
  12. curl_setopt($ci,CURLOPT_URL,$url); 
  13. curl_setopt($ci, CURLOPT_SSL_VERIFYPEER, false); 
  14. curl_setopt($ci, CURLOPT_SSL_VERIFYHOST, false); 
  15. curl_setopt($ci, CURLOPT_RETURNTRANSFER, 1); 
  16. $result = curl_exec($ch); 

2.查找html元素

使用find函數(shù)查找,返回包含對(duì)象的數(shù)組,常見(jiàn)的查找如下.

  1. //查找超鏈接元素 
  2. $alink = $html->find('a'); 
  3. //查找第n個(gè)連接元素 
  4. $alink = $html->find('a',5); 
  5. //查找id為main的div 
  6. $mainDiv = $html->find('div[id=main]'); 
  7. //查找所有定義了id的div 
  8. $idDiv = $html->find('div[id]'); 
  9. //查找所有定義了id的元素 
  10. $idAll = $html->find('[id]'); 
  11. //查找樣式類為info的元素 
  12. $classInfo = $html->find('.info'); 
  13. //支持嵌套子元素查找 
  14. $ret = $html->find('ul li'); 
  15. //查找多個(gè)html元素 
  16. $ret = $html->find('a,img,p'); 
  17. //....  

3.其他

可以使用內(nèi)置的函數(shù)來(lái)進(jìn)行元素的定位,返回父元素parent,返回子元素?cái)?shù)組children,返回第一個(gè)子元素first_child,返回最后一個(gè)子元素last_child,返回前一個(gè)相鄰元素prev_sibling,返回后一個(gè)相鄰元素next_sibling等.提供簡(jiǎn)單的正則表達(dá)式來(lái)過(guò)濾屬性選擇器,類似于[attribute]的格式.

每個(gè)對(duì)象都有4個(gè)基本屬性:

tag — 返回html標(biāo)簽名

innertext — 返回innerHTML

outertext — 返回outerHTML

plaintext — 返回HTML標(biāo)簽中的文本

返回元素屬性值:

  1. //返回$alink的href值 
  2. $link = $alink->href;  

通過(guò)設(shè)置元素的屬性值可以對(duì)元素進(jìn)行添加、修改、刪除操作,代碼如下:

  1. //刪除url連接 
  2. $alink->href = null; 
  3. //元素的修改 
  4. $ret->outertext = '<div class="nav">' . $ret->outertext . '</div>'
  5. $ret->outertext = ''
  6. $ret->outertext = $ret->outertext . '<div>other</div>'
  7. $ret->outertext = '<div>Welcome</div>' . $ret->outertext;  
  8. -EOF- 

發(fā)表評(píng)論 共有條評(píng)論
用戶名: 密碼:
驗(yàn)證碼: 匿名發(fā)表
主站蜘蛛池模板: 布拖县| 通山县| 鄂尔多斯市| 那坡县| 临汾市| 长海县| 涿鹿县| 宜良县| 怀远县| 轮台县| 滕州市| 浠水县| 同江市| 修水县| 博兴县| 翁源县| 保靖县| 平利县| 谢通门县| 历史| 神农架林区| 田阳县| 台北市| 九江县| 岑溪市| 铜山县| 华亭县| 射阳县| 金湖县| 海安县| 岢岚县| 和田县| 晋宁县| 滕州市| 阿拉善左旗| 大荔县| 颍上县| 玛曲县| 景东| 九江县| 鱼台县|