国产探花免费观看_亚洲丰满少妇自慰呻吟_97日韩有码在线_资源在线日韩欧美_一区二区精品毛片,辰东完美世界有声小说,欢乐颂第一季,yy玄幻小说排行榜完本

首頁 > 編程 > Ruby > 正文

ruby 正則表達式 教程

2020-10-29 19:48:02
字體:
來源:轉載
供稿:網友
我們再看一個更有趣的程序.這次我們來測試一個字符串是否和一個由簡明模式(concise pattern)編碼產生的描述相匹配.

在這些模式(pattern)里,一些字符或字符組合都有獨特的意義,包括: 

復制代碼 代碼如下:

[]  范圍描述符 (比如,[a - z] 表示在a 到 z 范圍內的一個字母)   

/w  字母或數字;相當于 [0-9A-Za-z]  

/W  非字母,數字  

/s  [ /t/n/r/f]空字符;相當于 [ /t/n/r/f]  

/S  非空字符  

/d  [0-9]數字;相當于 [0-9]  

/D  非數字字符  

/b  退格符 (0x08) (僅在范圍描述符內部時)  

/b  字邊界(word boundary) (在范圍描述符外部時)  

/B  非字邊界  

*  前面元素出現0或多次  

+  前面元素出現1或多次  

{m,n}  前面元素最少出現m次,最多出現n次  

?  前面元素最多出現1次;相當于 {0,1}  

|  與前面或后面的表達式匹配  

()  群( grouping)   


那些模式中共同使用的古怪詞匯叫做正則表達式.就象Perl一樣,Ruby也用前斜杠(而不是雙引號)將它們括起來.如果你以前從未使用過正則表達式,也許它們看起來除了規則(regular)什么都不是,但花上一點兒時間了解它們是明智的.當你需要對字符串進行模式匹配,查找或其它操作時,它的高效的表達能力能治好你的頭痛(并節約很多行代碼).

舉個例子,設想我們想要測試一個字符串是否符合這樣的描述信息"由小寫f開頭,跟一個大寫字母,并可能跟許多非小寫字母在后面."如果你是一個老練的C程序員,大概你的頭腦里已經裝滿幾十行程序了,對不對?承認吧,你難以控制住自己.在Ruby里,你只需要將你的字符串用正則表達式/^f[A-Z](^[a-z])*$/檢驗一下就可以了.

那"一個由<>括起來的16位數呢"?沒問題.

復制代碼 代碼如下:

ruby> def chab(s)   # "contains hex in angle brackets" 
    |    (s =~ /<0(x|X)(/d|[a-f]|[A-F])+>/) != nil 
    | end 
  nil 
ruby> chab "Not this one." 
  false 
ruby> chab "Maybe this? {0x35}"    # wrong kind of brackets 
  false 
ruby> chab "Or this? <0x38z7e>"    # bogus hex digit 
  false 
ruby> chab "Okay, this: <0xfc0004>." 
  true   


雖然,初看起來正則表達式挺讓人頭痛的,但你很快會因能夠如此高效地表達出你心中的意思而感到滿足.

下面是一個可以幫助你實驗正則表達式的小程序,把它存為regx.rb,然后在命令行里輸入'ruby regx.rb'運行.

復制代碼 代碼如下:

# Requires an ANSI terminal! 
st = "/033[7m" 
en = "/033[m" 
while TRUE   
    print "str> "   
    STDOUT.flush   
    str = gets   
    break if not str   
    str.chop!   
    print "pat> "   
    STDOUT.flush   
    re = gets   
    break if not re   
    re.chop!   
    str.gsub! re, "#{st}//&#{en}"   
    print str, "/n" 
end 
print "/n"   


這個小程序要求輸入兩次,一次字符串,一次正則表達式.輸入的字符串由正則表達式檢驗,然后用反視高亮度顯示所有匹配部分.先別管細節,等會兒就有代碼分析.

復制代碼 代碼如下:

str> foobar 
pat> ^fo+ 
foobar 
~~~   

上面紅色部分將在程序輸入中以反視表示出.下面的"~~~"行是為了方便那些使用基于字符瀏覽器的人.

我們再試幾個輸入:

str> abc012dbcd555
pat> /d
abc012dbcd555 


如果讓你感到驚訝,看看本頁開頭部分的那個表格: /d與字母d無關,而是對應于單個數字.

如果有不止一種方法能匹配模式會怎樣呢?

str> foozboozer
pat> f.*z
foozboozer
~~~~~~~~  


之所以foozbooz被匹配而不只是fooz,是因為一個正則表達符盡可能匹配最長的子串.

下面是一個將冒號分隔的數字時間段從字符串中隔離出來的模式匹配.

str> Wed Feb  7 08:58:04 JST 1996
pat> [0-9]+:[0-9]+(:[0-9]+)?
Wed Feb  7 08:58:04 JST 1996 


"=~"是一個用于匹配正則表達式的匹配(matching)運算符;它會返回在字符串里找到的匹配的位置,或者返回 nil 表示模式無法匹配.

ruby> "abcdef" =~ /d/
   3
ruby> "aaaaaa" =~ /d/
   nil  
發表評論 共有條評論
用戶名: 密碼:
驗證碼: 匿名發表
主站蜘蛛池模板: 伊宁市| 沁源县| 丘北县| 七台河市| 台安县| 宁明县| 玉门市| 城固县| 汤原县| 巴里| 陕西省| 成安县| 睢宁县| 福贡县| 淮阳县| 静宁县| 临泉县| 云梦县| 保靖县| 北流市| 临夏市| 溆浦县| 石首市| 平罗县| 米易县| 穆棱市| 八宿县| 无极县| 利辛县| 宁德市| 福贡县| 基隆市| 修武县| 佛山市| 辽中县| 手游| 华宁县| 罗源县| 宜宾县| 邢台市| 巴马|