徐帥 許海
摘要:該文主要介紹正則表達(dá)式的最基礎(chǔ)的快速入門,以便從未了解過(guò)正則表達(dá)式的人對(duì)它初步了解及簡(jiǎn)單使用。關(guān)鍵詞:正則表達(dá)式;快速入門
中圖分類號(hào):TP3 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2019)29-0269-02
該文主要涉及正則表達(dá)式的最基礎(chǔ)的快速入門。在讀完-本文后可能還是無(wú)法熟練有效的使用正則表達(dá)式,因?yàn)楸疚闹荚谧審奈戳私膺^(guò)正則表達(dá)式的人初步了解以及簡(jiǎn)單地使用它,在進(jìn)行深入的學(xué)習(xí)的時(shí)候輕松一些,想要熟練掌握正則表達(dá)式還需要你去更深入地去學(xué)習(xí)和使用它。
1正則表達(dá)式
正則表達(dá)式是描述一定匹配規(guī)則的特殊文本字符或字符串,用于判斷字符串格式或者提取字符串內(nèi)容。它最基本的模式,只是匹配文字。例如“\b[A ZO-9._%+-]+@[A-ZO-9.-]+\.[A-Z]{2,}\b”,這是一個(gè)較復(fù)雜的模式。它描述了一系列字母,數(shù)字,點(diǎn),下劃線,百分號(hào)和連字符,后跟一個(gè)@符號(hào),后跟另一系列字母,數(shù)字和連字符,最后是一個(gè)點(diǎn)和兩個(gè)或多個(gè)字母。如果仔細(xì)看就會(huì)發(fā)現(xiàn),此模式描述了一個(gè)電子郵件地址。使用上述正則表達(dá)式模式,您可以搜索文本文件以查找電子郵件地址,或驗(yàn)證給定字符串是否與電子郵件地址相似。下面講的就是上述正則表達(dá)式所用到的一些知識(shí)。
2文字字符
最基本的正則表達(dá)式是由單個(gè)文字字符組成。例如“a”,它匹配字符串中首次出現(xiàn)的該字符;在字符串“Java”中,他就匹配“J”后面的那個(gè)“a”。
另外,還有一些特殊字符——“元字符”的存在。元字符在單獨(dú)使用時(shí)大多數(shù)是錯(cuò)誤的,因?yàn)樵址谡齽t表達(dá)式中具有特殊含義,所以要將元字符用作正則表達(dá)式中的文字,則需要使用反斜杠“\”來(lái)轉(zhuǎn)義它們。例如要匹配“1+1=2”,則正確的表達(dá)式為“1\+1=2”,否則的話,加號(hào)具有特殊含義。請(qǐng)注意,省略反斜杠的1+1=2是有效的正則表達(dá)式。所以你不會(huì)收到錯(cuò)誤信息。但它與1+1=2不匹配。它將匹配11l=2在123+111=234。
3字符類或字符集
“字符類(字符集)”僅匹配多個(gè)字符中的一個(gè)字符。例如你想匹配某個(gè)元音字母,你可以將“a、e、i、o、u”這幾個(gè)字母用方括號(hào)“[]”括起來(lái),這樣你就可以匹配任一元音字符,但是如果是“ae”或“ai”這樣的兩個(gè)字符同時(shí)出現(xiàn)就無(wú)法匹配,只能匹配前一個(gè)元音字符。你也可以在字符類中使用連字符來(lái)指定字符范圍。例如“[0-9]”可以匹配0-9之間的任一數(shù)字,“[a-Z]”可以匹配任一小寫字母。你還可以在開(kāi)始方括號(hào)“[”后鍵入一個(gè)插入符號(hào)“∧”來(lái)匹配任一不在字符類中的字符。