1. 程式人生 > 程式設計 >JavaScript正則表示式匹配字串字面量

JavaScript正則表示式匹配字串字面量

第一次遇到這個問題,是大概兩年前寫程式碼高亮,從當時的解決方案到現在一共有三代,嘎嘎. 覺得還是算越來越好的.

第一代:

//那個時候自己正則還不算很精通,也沒有(?:...)這種習慣,是以尋找結束引號為入口寫出的這個正則. 思路混亂,也存在錯誤.
//比如像字面量 "abc\\\"",則會匹配為 "abc\\\",而正確的結果應該是 "abc\\\"".
var re = /('('|.*?([^\\]'|\\\\'))|"("|.*?([^\\]"|\\\\")))/g;

第二代:

//這個匹配其實和第一代思路基本相同,也是尋找結束引號,通過給\\新增*解決了第一代的bug.
var re = /(['"])(?:.*?[^\\](?:\\\\)*)?\1/g;

第三代:

//老實說第三代是昨天晚上出題的時候突然想出來的(後來又修改過),支援多行字串字面量,思路也有了較大的轉變,從匹配結束引號變味了匹配中間內容.
var re = /(['"])(?:\\(?:\r\n|[\s\S])|[^\\\r\n])*?\1/g

這裡有一個正則裡非常常用的技巧,姑且稱之為 “搶佔”,在諸如/a|./這樣的正則裡,越靠前越先匹配,通過 “搶佔” 一些字元,可以避開很多麻煩. 說起來有些抽象,在上面這個例子裡,/\\[\s\S]/就可以很自然地搶到 \” 這樣的轉義字元,所以不必擔心轉義字元中的 ” 給匹配造成影響. 這是區域性的 “搶佔”,還有更大範圍的,比如註釋裡的字串或者字串裡的註釋,只要在同一個正則中,把相關匹配都寫入,則一定是先遇到的優先. 如 /(註釋正則)|(字串正則)/g,可以先通過這樣的方式,把內容匹配出來,再進行進一步判斷處理.

雖然可能對於多數人來說,用處不大,但萬一呢? Best wishes~