溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

正則表達式學習之回溯引用backreference的示例分析

發(fā)布時間:2021-08-25 09:52:38 來源:億速云 閱讀:129 作者:小新 欄目:互聯(lián)網科技

這篇文章將為大家詳細講解有關正則表達式學習之回溯引用backreference的示例分析,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。

一、問題引入

一個在HTML頁面中匹配標題標簽(H1—H6)的問題:

文本:

<body>
<h2>Welcome to my page</H1>
Content is divided into twosections:<br>
<h3>Introduction</h3>
Information about me.
<H2>Hobby</H2>
Information about my hobby.
<h3>This is invalid HTML</h4>
</body>

正則表達式:<[hH][1-6]>.*?</[hH][1-6]>

結果:

<body>
【<h2>Welcome to my page</H1>】
Content is divided into twosections:<br>
【<h3>Introduction</h3>】
Information about me.
【<H2>Hobby</H2>】
Information about my hobby.
【<h3>This is invalid HTML</h4>】
</body>

分析:模式<[hH][1-6]>匹配任何一級標題的開始標簽,而且不區(qū)分大小寫,在這個例子中它匹配到了<h2>、<h3>,</[hH][1-6]>匹配到了</h2>、</h3>、</h4>;這里使用了懶惰型元字符來匹配標簽中的文本,否則會匹配到從第一個開始標簽到最后一下結束標簽之間的內容。但是從結果可以看出,有一個無效的標簽也匹配上了,即<h3></h4>,它們根本不能配對。要解決這個問題,就需要使用到回溯引用(backreference)。

二、回溯引用匹配

回溯引用是指模式的后半部分引用在前半部分中定義的子表達式。至于子表達式的使用、劃分和引用,在前面已經介紹過了。現(xiàn)在來解決前面的例子:

文本:

<body>
<h2>Welcome to my page</H1>
Content is divided into twosections:<br>
<h3>Introduction</h3>
Information about me.
<H2>Hobby</H2>
Information about my hobby.
<h3>This is invalid HTML</h4>
</body>

正則表達式:<[hH]([1-6])>.*?</[hH]\1>

結果:

<body>
【<h2>Welcome to my page</H1>】
Content is divided into twosections:<br>
【<h3>Introduction</h3>】
Information about me.
【<H2>Hobby</H2>】
Information about my hobby.
<h3>This is invalid HTML</h4>

分析:首先匹配開始標題標簽的模式<[hH]([1-6])>,使用括號把[1-6]做為子表達式,而匹配結束標題標簽模式為</[hH]\1>,其中\(zhòng)1表示引用第一個子表達式,即([1-6]),如果([1-6])匹配到的是1,那\1也匹配到1,如果匹配到2,那\1也匹配到2,所以最后一個無效的標題標簽就不會被匹配到了。

關于“正則表達式學習之回溯引用backreference的示例分析”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,使各位可以學到更多知識,如果覺得文章不錯,請把它分享出去讓更多的人看到。

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI