模式修飾符

下面列出了當(dāng)前可用的 PCRE 修飾符。括號中提到的名字是 PCRE 內(nèi)部這些修飾符的名稱。 模式修飾符中的空格,換行符會被忽略,其他字符會導(dǎo)致錯誤。

i (PCRE_CASELESS)
如果設(shè)置了這個修飾符,模式中的字母會進(jìn)行大小寫不敏感匹配。
m (PCRE_MULTILINE)
默認(rèn)情況下,PCRE 認(rèn)為目標(biāo)字符串是由單行字符組成的(然而實際上它可能會包含多行), "行首"元字符 (^) 僅匹配字符串的開始位置, 而"行末"元字符 ($) 僅匹配字符串末尾, 或者最后的換行符(除非設(shè)置了 D 修飾符)。這個行為和 perl 相同。 當(dāng)這個修飾符設(shè)置之后,“行首”和“行末”就會匹配目標(biāo)字符串中任意換行符之前或之后,另外, 還分別匹配目標(biāo)字符串的最開始和最末尾位置。這等同于 perl 的 /m 修飾符。如果目標(biāo)字符串 中沒有 "\n" 字符,或者模式中沒有出現(xiàn) ^ 或 $,設(shè)置這個修飾符不產(chǎn)生任何影響。
s (PCRE_DOTALL)
如果設(shè)置了這個修飾符,模式中的點號元字符匹配所有字符,包含換行符。如果沒有這個 修飾符,點號不匹配換行符。這個修飾符等同于 perl 中的/s修飾符。 一個取反字符類比如 [^a] 總是匹配換行符,而不依賴于這個修飾符的設(shè)置。
x (PCRE_EXTENDED)
如果設(shè)置了這個修飾符,模式中的沒有經(jīng)過轉(zhuǎn)義的或不在字符類中的空白數(shù)據(jù)字符總會被忽略, 并且位于一個未轉(zhuǎn)義的字符類外部的#字符和下一個換行符之間的字符也被忽略。 這個修飾符 等同于 perl 中的 /x 修飾符,使被編譯模式中可以包含注釋。 注意:這僅用于數(shù)據(jù)字符。 空白字符 還是不能在模式的特殊字符序列中出現(xiàn),比如序列 (?( 引入了一個條件子組(譯注: 這種語法定義的 特殊字符序列中如果出現(xiàn)空白字符會導(dǎo)致編譯錯誤。 比如(?(就會導(dǎo)致錯誤)。
A (PCRE_ANCHORED)
如果設(shè)置了這個修飾符,模式被強(qiáng)制為"錨定"模式,也就是說約束匹配使其僅從 目標(biāo)字符串的開始位置搜索。這個效果同樣可以使用適當(dāng)?shù)哪J綐?gòu)造出來,并且 這也是 perl 種實現(xiàn)這種模式的唯一途徑。
D (PCRE_DOLLAR_ENDONLY)
如果這個修飾符被設(shè)置,模式中的元字符美元符號僅僅匹配目標(biāo)字符串的末尾。如果這個修飾符 沒有設(shè)置,當(dāng)字符串以一個換行符結(jié)尾時, 美元符號還會匹配該換行符(但不會匹配之前的任何換行符)。 如果設(shè)置了修飾符m,這個修飾符被忽略. 在 perl 中沒有與此修飾符等同的修飾符。
S
當(dāng)一個模式需要多次使用的時候,為了得到匹配速度的提升,值得花費一些時間 對其進(jìn)行一些額外的分析。如果設(shè)置了這個修飾符,這個額外的分析就會執(zhí)行。當(dāng)前, 這種對一個模式的分析僅僅適用于非錨定模式的匹配(即沒有單獨的固定開始字符)。
U (PCRE_UNGREEDY)
這個修飾符逆轉(zhuǎn)了量詞的"貪婪"模式。 使量詞默認(rèn)為非貪婪的,通過量詞后緊跟? 的方式可以使其成為貪婪的。這和 perl 是不兼容的。 它同樣可以使用 模式內(nèi)修飾符設(shè)置 (?U)進(jìn)行設(shè)置, 或者在量詞后以問號標(biāo)記其非貪婪(比如.*?)。

注意:

在非貪婪模式,通常不能匹配超過 pcre.backtrack_limit 的字符。

X (PCRE_EXTRA)
這個修飾符打開了 PCRE 與 perl 不兼容的附件功能。模式中的任意反斜線后就 ingen 一個 沒有特殊含義的字符都會導(dǎo)致一個錯誤,以此保留這些字符以保證向后兼容性。 默認(rèn)情況下,在 perl 中,反斜線緊跟一個沒有特殊含義的字符被認(rèn)為是該字符的原文。 當(dāng)前沒有其他特性由這個修飾符控制。
J (PCRE_INFO_JCHANGED)
內(nèi)部選項設(shè)置(?J)修改本地的PCRE_DUPNAMES選項。允許子組重名, (譯注:只能通過內(nèi)部選項設(shè)置,外部的 /J 設(shè)置會產(chǎn)生錯誤。) 自 PHP 7.2.0 起,也能支持 J 修飾符。
u (PCRE_UTF8)
此修正符打開一個與 Perl 不兼容的附加功能。 模式和目標(biāo)字符串都被認(rèn)為是 UTF-8 的。 無效的目標(biāo)字符串會導(dǎo)致 preg_* 函數(shù)什么都匹配不到; 無效的模式字符串會導(dǎo)致 E_WARNING 級別的錯誤。 5 字節(jié)和 6 字節(jié)的 UTF-8 字符序列以無效字符序列對待。