本文實例講述了php使用simple_html_dom解析HTML的方法。分享給大家供大家參考,具體如下:
今天寫了兩個爬蟲, 一個使用Python, 一個使用PHP, 說實在, 兩個實現的方式都很方便.
下面說一下使用simple_html_dom這個開源類來解析HTML代碼:
1. 下載simple_html_dom:
http://sourceforge.net/projects/simplehtmldom/files/
2. 用法示例:
<?php// example of how to use basic selector to retrieve HTML contentsinclude('../simple_html_dom.php');// get DOM from URL or file$html = file_get_html('http://www.google.com/');// find all linkforeach($html->find('a') as $e) echo $e->href . '<br>';// find all imageforeach($html->find('img') as $e) echo $e->src . '<br>';// find all image with full tagforeach($html->find('img') as $e) echo $e->outertext . '<br>';// find all div tags with id=gbarforeach($html->find('div#gbar') as $e) echo $e->innertext . '<br>';// find all span tags with class=gb1foreach($html->find('span.gb1') as $e) echo $e->outertext . '<br>';// find all td tags with attribite align=centerforeach($html->find('td[align=center]') as $e) echo $e->innertext . '<br>';// extract text from tableecho $html->find('td[align="center"]', 1)->plaintext.'<br><hr>';// extract text from HTMLecho $html->plaintext;?>希望本文所述對大家PHP程序設計有所幫助。
新聞熱點
疑難解答
圖片精選