溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Perl正則表達式如何使用

發(fā)布時間:2022-02-23 10:48:32 來源:億速云 閱讀:151 作者:小新 欄目:開發(fā)技術

小編給大家分享一下Perl正則表達式如何使用,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!

Perl正則表達式

Perl在IC設計中有廣泛的應用,而Perl的正則表達式則由其常見,它與Tcl等語言中的正則表達式有一定的相似之處,因此如果學習過相關正則表達式的話這個不會很難。

正則表達式的三種形式

    首先我們應該知道Perl程序中,正則表達式有三種存在形式,他們分別是:

        匹配:m/<regexp>/(還可以簡寫為/<regexp>/,略去m)

        替換:s/<pattern>/<replacement>/

        轉化:tr/<pattern>/<replacemnt>/

        這三種形式一般都和=~或!~搭配使用,并在左側有待處理的標量變量,如果沒有該變量和=~ !~操作符,則默認為處理$_變量中的內(nèi)容.

        (其中"=~"表示相匹配,在整條語句中讀作does,"!~"表示不匹配,在整條語句中讀作doesn't)

    舉例如下:

      $str="I lovePerl";

        $str=~m/Perl/;#表示如果在$str中發(fā)現(xiàn)"Perl"字符串,則返回"1"否則返回"0".

        $str=~s/Perl/BASH/;#表示將變量$str中的"Perl"字符串替換為"BASH",如果發(fā)生此替換則返回"1",否則返回"0".

        $str!~tr/A-Z/a-z/;#表示將變量$str中的所有大寫字母轉化為小寫字母,如果轉化發(fā)生了則返回"0",否則返回"1".

      另外還有:

       foreach(@array){s/a/b/;}#此處每次循環(huán)將從@array數(shù)組中取出一個元素存放在$_變量中,并對$_進行替換處理.

       while(<FILE>){print if(m/error/);}#這一句稍微復雜一些,他將打印FILE文件中所有包含error字符串的行.

    Perl的正則表達式中如果出現(xiàn)(),則發(fā)生匹配或替換后()內(nèi)的模式被Perl解釋器自動依次賦給系統(tǒng)$1,$2......

      請看下面的例子:

          $string="Ilove perl";

           $string=~s/(love)/<$1>/; #此時$1="love",并且該替換的結果是將$string變?yōu)?quot;I<love>perl"

          $string="ilove perl";

           $string=~s/(i)(.*)(perl)/<$3>$2<$1>/;#這里$1="i",$2="love",$3="perl",并且替換后$string變?yōu)?quot;<perl>love<i>"

1、模式匹配

1.1、匹配操作符

匹配操作符 m// 用于匹配一個字符串語句或者一個正則表達式,例如,要匹配標量$bar 中的"run",代碼如下所示:

實例

#!/usr/bin/perl

$bar = "I am runoob site. welcome to runoob site.";

if ($bar =~ /run/){

   print "第一次匹配\n";

}else{

   print "第一次不匹配\n";

}

$bar = "run";

if ($bar =~ /run/){

   print "第二次匹配\n";

}else{

   print "第二次不匹配\n";

}

執(zhí)行以上程序,輸出結果為:

第一次匹配

第二次匹配

1.2、模式匹配修飾符

模式匹配有一些常用的修飾符,如下表所示:

修飾符

描述

i

忽略模式中的大小寫

m

多行模式

o

僅賦值一次

s

單行模式,"."匹配"\n"(默認不匹配)

x

忽略模式中的空白

g

全局匹配

cg

全局匹配失敗后,允許再次查找匹配串

1.3、正則表達式變量

perl處理完后會給匹配到的值存在三個特殊變量名:

  • $`: 匹配部分的前一部分字符串

  • $&: 匹配的字符串

  • $': 還沒有匹配的剩余字符串

如果將這三個變量放在一起,你將得到原始字符串。

實例如下:

實例

#!/usr/bin/perl

$string = "welcome to runoob site.";

$string =~ m/run/;

print "匹配前的字符串:$`\n";

print "匹配的字符串:$&\n";

print "匹配后的字符串:$'\n";

執(zhí)行以上程序輸出結果為:

匹配前的字符串:welcome to

匹配的字符串: run

匹配后的字符串: oobsite.

2、模式替換

2.1、替換操作符

替換操作符 s/// 是匹配操作符的擴展,使用新的字符串替換指定的字符串?;靖袷饺缦拢?/p>

s/PATTERN/REPLACEMENT/;

PATTERN 為匹配模式,REPLACEMENT為替換的字符串。

例如我們將以下字符串的"google" 替換為"runoob":

實例

#!/usr/bin/perl

$string = "welcome to google site.";

$string =~ s/google/runoob/;

print "$string\n";

執(zhí)行以上程序輸出結果為:

welcome to runoob site.

2.2、替換操作修飾符

替換操作修飾符如下表所示:

修飾符

描述

i

如果在修飾符中加上"i",則正則將會取消大小寫敏感性,即"a"和"A" 是一樣的。

m

默認的正則開始"^"和結束"$"只是對于正則字符串如果在修飾符中加上"m",那么開始和結束將會指字符串的每一行:每一行的開頭就是"^",結尾就是"$"。

o

表達式只執(zhí)行一次。

s

如果在修飾符中加入"s",那么默認的"."代表除了換行符以外的任何字符將會變成任意字符,也就是包括換行符!

x

如果加上該修飾符,表達式中的空白字符將會被忽略,除非它已經(jīng)被轉義。

g

替換所有匹配的字符串。

e

替換字符串作為表達式

    例如:

       s/<pattern>/<replacement>/g 表示把待處理字符串中所有符合<pattern>的模式全部替換為<replacement>字符串.

       s/<pattern>/<replacement>/e表示將把<replacemnet>部分當作一個運算符,這個參數(shù)用的不多.

        比如下面的例子:

         $string="i:love:perl";

            $string=~s/:/*/;#此時$string="i*love:perl";

           $string=~s/:/*/g;#此時$string="i*love*perl";

            $string=~tr/*//;#此時$string="iloveperl";

         $string="www22cgi44";

           $string=~s/(\d+)/$1*2/e;#(/d+)代表$string中的一個或多個數(shù)字字符,將這些數(shù)字字符執(zhí)行*2的操作,因此最后$string變成了"www44cgi88".

3、模式轉化

這是另一種替換方式,語法如:tr/string1/string2/。同樣,string2為替換部分,但其效果是把string1中的第一個字符替換為string2中的第一個字符,把string1中的第二個字符替換為string2中的第二個字符,依此類推。如:

$string = "abcdefghicba";

$string =~ tr/abc/def/; # now string = "defdefghifed"

當string1比string2長時,其多余字符替換為string2的最后一個字符;當string1中同一個字符出現(xiàn)多次時,將使用第一個替換字符。

例如:

#!/usr/bin/perl

$str = "abbcddeff";

$str =~ tr/abcc/ABCD/;

print "$str\n";

將輸出:

ABBCddeff

3.1、轉化操作符

以下是轉化操作符相關的修飾符:

修飾符

描述

c

轉化所有未指定字符

d

刪除所有指定字符

s

把多個相同的輸出字符縮成一個

以下實例將變量 $string中的所有小寫字母轉化為大寫字母:

#!/usr/bin/perl

$string = 'welcome to runoob site.';

$string =~ tr/a-z/A-Z/;

print "$string\n";

執(zhí)行以上程序輸出結果為:

WELCOME TO RUNOOB SITE.

以下實例使用 /s 將變量 $string 重復的字符刪除:

實例

#!/usr/bin/perl

$string = 'runoob';

$string =~ tr/a-z/a-z/s;

print "$string\n";

執(zhí)行以上程序輸出結果為:

runob

更多實例:

$string =~ tr/\d/ /c;     # 把所有非數(shù)字字符替換為空格

$string =~ tr/\t //d;     # 刪除tab和空格

$string =~ tr/0-9/ /cs    # 把數(shù)字間的其它字符替換為一個空格。

正則表達式中的常用模式.

    /pattern/                    結果

    .                               匹配除換行符以外的所有字符

    x?                             匹配0次或一次x字符串

    x*                             匹配0次或多次x字符串,但匹配可能的最少次數(shù)

    x+                             匹配1次或多次x字符串,但匹配可能的最少次數(shù)

    .*                              匹配0次或多次的任何字符

    .+                             匹配1次或多次的任何字符

    x{m}            匹配剛好是m個x的指定字符串

    x{m,n}                     匹配大于等于m個,小于等于n個x的指定字符串

    x{m,}                       匹配大于等于m個x的指定字符串

    []                              匹配符合[]內(nèi)的字符

    [^]                            匹配不符合[]內(nèi)的字符

    [0-9]                         匹配所有數(shù)字字符

    [a-z]                          匹配所有小寫字母字符

    [^0-9]                        匹配所有非數(shù)字字符

    [^a-z]            匹配所有非小寫字母字符

    ^                               匹配字符開頭的字符

    $                               匹配字符結尾的字符

    \d                              匹配一個數(shù)字的字符,和[0-9]語法一樣

    \d+                            匹配多個數(shù)字字符串,和[0-9]+語法一樣

    \D                             非數(shù)字,其他同\d

    \D+                           非數(shù)字,其他同\d+

    \w                             英文字母或數(shù)字的字符串,和[a-zA-Z0-9]語法一樣

    \w+                           和[a-zA-Z0-9]+語法一樣

    \W                            非英文字母或數(shù)字的字符串,和[^a-zA-Z0-9]語法一樣

    \W+                          和[^a-zA-Z0-9]+語法一樣

    \s                              空格,和[\n\t\r\f]語法一樣

    \s+                            和[\n\t\r\f]+一樣

    \S                             非空格,和[^\n\t\r\f]語法一樣

    \S+                           和[^\n\t\r\f]+語法一樣

    \b                              匹配以英文字母,數(shù)字為邊界的字符串

    \B                             匹配不以英文字母,數(shù)值為邊界的字符串

    a|b|c                          匹配符合a字符或是b字符或是c字符的字符串

    abc                           匹配含有abc的字符串

    (pattern)                   ()這個符號會記住所找尋到的字符串,是一個很實用的語法。第一個()內(nèi)所找到的字符串變成$1這個變量或是\1變量,第二個()內(nèi)所找到的字符串變成$2這個變量或是\2變量,以此類推下去。

    /pattern/i                   i這個參數(shù)表示忽略英文大小寫,也就是在匹配字符串的時候,

看完了這篇文章,相信你對“Perl正則表達式如何使用”有了一定的了解,如果想了解更多相關知識,歡迎關注億速云行業(yè)資訊頻道,感謝各位的閱讀!

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。

AI