可以使匹配器根據(jù)一個斷言的結(jié)果, 或者之前的一個捕獲子組是否匹配來條件式的匹配一個子組或者在兩個可選子組中選擇。 條件子組的兩種語法如下:
(?(condition)yes-pattern) (?(condition)yes-pattern|no-pattern)
如果條件滿足,使用 yes-pattern,其他情況使用 no-pattern(如果指定了)。 如果有超過 2 個的可選子組,會產(chǎn)生給一個編譯期錯誤。
條件一共有兩種。如果在(condition)的括號內(nèi)是數(shù)字組成的文本, 條件在該數(shù)字代表的(之前的)子組得到匹配時滿足(即使用 yes-pattern)。 考慮下面的模式, 為了使其易于閱讀其中增加了一些空白字符(查看PCRE_EXTENDED 選項)并且將其分為三個部分:
( \( )? [^()]+ (?(1) \) )
模式的第一部分匹配一個可選的左括號,并且如果該字符出現(xiàn),
設(shè)置其為第一個子組的捕獲子串。第二部分匹配一個或多個非括號字符。
第三部分是一個條件子組,它會測試第一個子組是否匹配,如果匹配到了,
也就是說目標(biāo)字符串以左括號開始,條件為true
,
那么使用 yes-pattern 也就是這里需要匹配一個右括號。其他情況下,
既然 no-pattern 沒有出現(xiàn),這個子組就不匹配任何東西。換句話說,
這個模式匹配一個沒有括號的或者閉合括號包裹的字符序列。
如果條件式字符串 (R)
,它在得到對模式或子模式的遞歸調(diào)用時滿足。
在”最上級”,條件總是false。
如果條件不是數(shù)字序列或(R),它就必須是一個斷言。這里的斷言可以使任意的,積極, 消極,正向,后向都是可以的??紤]這個模式, 同樣為了方便閱讀, 增加了一些空白字符,并且在第二行有兩個可選路徑。
(?(?=[^a-z]*[a-z]) \d{2}-[a-z]{3}-\d{2} | \d{2}-\d{2}-\d{2} )
條件式一個正向積極斷言,匹配一個可選的非小寫字母字符序列緊接著一個小寫字母。 換一種說法,它測試目標(biāo)中至少出現(xiàn)一個小寫字母,如果小寫字母發(fā)現(xiàn), 目標(biāo)匹配第一個可選分支,其他情況下它匹配第二個分支。 這個模式匹配兩種格式的字符串:dd-aaa-dd 或 dd-dd-dd。aaa 代表小寫字母, dd 是數(shù)字。