国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Regex > 正文

coolcode轉SyntaxHighlighter與Mysql正則表達式實現分析

2020-03-16 21:11:51
字體:
來源:轉載
供稿:網友
blog的代碼高亮插件原來是coolcode的,coolcode的高亮插件確實很酷,顯示效果也很棒,但是占用的位子太大了。
 
 
最近,我抽空改成SyntaxHighlighter。由于coolcode插件的開頭標簽是 
<coolcode> 
或者[coolcode]這樣的,而SyntaxHighlighter是 

[code lang="php"] 
這樣的(或者其他)。遂只能想辦法把老的格式轉化成新的格式。當然,肯定用到正則表達式了。 
原來的代碼高亮開頭標識為 

<coolcode lang="php" download="123.php" linenum="on"><coolcode lang="php" linenum="off"><coolcode lang="php"> 
這種類型的, 
而SyntaxHighlighter的標識為 

[code lang="php"] 
那根據要求寫的正則表達式為 

<coolcode lang="[a-z]+".*?> 
解釋一下 
復制代碼代碼如下:

[a-z]+ 匹配 php,javascript,cpp,sql,css 等,后面的.*?中的 .表示任何除了換行之外的字符,而*表示0次或者無數次,*+這些表述次數的符號后面接的?標識非貪婪模式 

coolcode轉SyntaxHighlighter與Mysql正則表達式實現分析
看圖,這個正則可以實現上述要求了。 

但是,問題還沒解決,我們還有一種情況沒考慮,那就是 
<coolcode 
后面不一定接的就是lang="php"這樣的屬性啊,有可能是download,也有可能是linenum="on/off"啊,所以,我們的正則還需要改。 
CFC4N把正則改為 
<coolcode.*?lang="[a-z]+".*?> 
截圖如下 
coolcode轉SyntaxHighlighter與Mysql正則表達式實現分析
細心的朋友可能看出來圖中匹配的紅色框內多出了 
<coolcode 
,意思也就是說,前面的 

<coolcode> 
需要排除掉。如何排除呢?聰明的你肯定立刻想到.這個萬能字符替換成非<>兩個符號的規則,好,CFC4N立刻修改一下。 
修改之后的正則為 

<coolcode.*?lang="[a-z]+".*?> 
果然,匹配正常了。結果見截圖。 
coolcode轉SyntaxHighlighter與Mysql正則表達式實現分析
到這里,問題似乎解決了,可是,當初糊涂的我,把coolcode的兩種開頭標識都用了,那就是 

<coolcode 
和[coolcode,那么,看官您認為這個正則該如何改寫呢? 
沒錯,無非就是開頭,結尾的標識考慮兩種情況<和[,那么正則就好改了。(別忘了排除規則里的符號哦) 
[</[]coolcode[^<>/[/]]*?lang="[a-z]+"[^<>/[/]]*?[>/]] 
嗯,好,我們來看下效果: 
coolcode轉SyntaxHighlighter與Mysql正則表達式實現分析
很好很完美。 
下面,就可以去執行了。 
可是,我遇到一個很意外的事情。居然發現老的代碼里包含這樣的格式 
[coolcode linenum=/"off/" lang=/"cpp/"]<coolcode download=/"/" lang=/"cpp/" linenum="off"> 
呃,問題在這里了,只是多了個轉義字符/罷了,那么,改起來,也簡單。也就是允許/出現0次或者一次,而標識0次或者1次的符號為?,那么我們直接在/后面加個?,也就是改成這樣/?就可以了嗎? 
顯然,不是。在正則表達式里,/也表示轉義,那么,匹配/的話,也得轉義一下/,則應該為//? 這樣才對。 
修改后正則為 
[</[]coolcode[^<>/[/]]*?lang=//?"[a-z]+//?"[^<>/[/]]*?[>/]] 
匹配結果見下圖: 
coolcode轉SyntaxHighlighter與Mysql正則表達式實現分析
現在,大功告成了。我們可以進行轉換了。關于轉換,我們可以用兩種方法。 

•Mysql的REPLACE函數,單個的去替換 
<coolcode lang="php/cpp/javascript/sql/css等" download="name" linenum="on/off"> 
為對應的 
[code lang="php/cpp/javascript/sql/css等"] 
,這樣操作,省的去寫程序,取出,替換,再寫入了,缺點是量大,手工也挺累,體力活。mysql僅僅支持正則查詢,不支持正則查詢的替換,我們也可以構造聯合嵌套的SQL來替換正則匹配的字符串,但是無法取出php/cpp/javascrip這樣的語言標記,替換為新的語言標記。也就是說,mysql不支持正則表達式的反向引用。 

•PHP讀數據庫,替換,再寫入。PHP的preg_replace函數支持反向引用(preg_replace不支持自定義組名的反向引用),我們只好寫個查詢語句,查詢包含coolcode標識的文章,然后再替換,當然,直接查詢包含coolcode的文章可能太多,我們也可以寫個MYSQL支持的POSIX正則引擎的表達式,來匹配使用coolcode標簽的文章,再來替換,寫入。以減少文章的操作量。當然正則表達式也會浪費很大的資源。 
當然,在PHP代碼的preg_replace函數使用上面的正則,進行反向引用時,需要對正則稍作修改。給lang=""中間的一個組名。正則修改為 
[</[]coolcode[^<>/[/]]*?lang=//?"([a-z]+//?)"[^<>/[/]]*?[>/]] 
PHP的替換代碼為 
$contents = preg_replace('/[<|[]coolcode[^>[/]]*?lang=////?"([^"]+?)////?"[^>[/]]*?[>|/]]/i','[code lang="//1"',$contents); 
其中正則的i修飾符標識不區分大小寫。 
coolcode轉SyntaxHighlighter與Mysql正則表達式實現分析
還有,別忘記了coolcode的結束標識和[/coolcode]要替換成[/code]。 
mysql里執行兩句sql即可 
復制代碼代碼如下:

UPDATE wp_posts SET post_content = REPLACE(post_content,'</coolcode>','[//code]'); //注意后面多了個反斜杠,記得去掉 
UPDATE wp_posts SET post_content = REPLACE(post_content,'[/coolcode]','[//code]'); //注意后面多了個反斜杠,記得去掉 

總結: 
本文牽扯的正則表達式并無高級用法,都是平常很簡單的用法。關于PCRE引擎正則表達式的遞歸(迭代),組命名,反向引用,零寬斷言等,CFC4N會在以后的時間里,找合適的例子寫出來。當然,這些高級用法,CFC4N在幫朋友寫的正則表達式里已經用到了,大家可以看看,歡迎批評和指點。 
PS:如果需要coolcode轉SyntaxHighlighter的完整PHP程序,留言即可,我抽空寫出來。

發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 沭阳县| 行唐县| 邹平县| 郑州市| 平安县| 汽车| 永康市| 遂溪县| 分宜县| 昔阳县| 成武县| 中西区| 苍南县| 二连浩特市| 彰化市| 凌云县| 金寨县| 平谷区| 乌苏市| 阜平县| 溆浦县| 且末县| 沈阳市| 大宁县| 普兰县| 潢川县| 沾益县| 安塞县| 平塘县| 巫溪县| 钟山县| 互助| 凤翔县| 洪泽县| 吴旗县| 乌拉特前旗| 军事| 虎林市| 太和县| 娄底市| 湘潭市|