国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Regex > 正文

php 正則表達式提取網頁超級鏈接url的函數

2020-03-16 21:14:02
字體:
來源:轉載
供稿:網友
php 正則表達式提取網頁超級鏈接url的函數
 
 
復制代碼代碼如下:

function match_links($document) { 
preg_match_all("'</s*a/s.*?href/s*=/s*([/"/'])?(?(1)(.*?)//1|([^/s/>]+))[^>]*>?(.*?)</a>'isx",$document,$links); 
while(list($key,$val) = each($links[2])) { 
if(!empty($val)) 
$match['link'][] = $val; 

while(list($key,$val) = each($links[3])) { 
if(!empty($val)) 
$match['link'][] = $val; 

while(list($key,$val) = each($links[4])) { 
if(!empty($val)) 
$match['content'][] = $val; 

while(list($key,$val) = each($links[0])) { 
if(!empty($val)) 
$match['all'][] = $val; 

return $match; 
}

主要是正則的問題,下面給出個asp.net下的,多測試正則
獲取頁面的鏈接正則 
復制代碼代碼如下:

public string GetHref(string HtmlCode) 

string MatchVale = ""; 
string Reg = @"(h|H)(r|R)(e|E)(f|F) *= *('|"")?((/w|//|//|/.|:|-|_)+)('|""| *|>)?"; 
foreach (Match m in Regex.Matches(HtmlCode, Reg)) 

MatchVale += (m.Value).ToLower().Replace("href=", "").Trim() + "||"; 

return MatchVale; 
}

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 麦盖提县| 浏阳市| 汶上县| 梧州市| 内黄县| 宿州市| 彰武县| 苍南县| 康保县| 夏津县| 大荔县| 柳林县| 郎溪县| 惠东县| 视频| 大丰市| 城口县| 吉木萨尔县| 平山县| 清徐县| 广水市| 三明市| 台南县| 罗山县| 房山区| 辽宁省| 巧家县| 河间市| 上饶县| 文昌市| 高陵县| 泊头市| 焉耆| 延长县| 两当县| 隆子县| 烟台市| 琼结县| 略阳县| 雷山县| 阿图什市|