溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

如何在c++11中使用regex正則表達(dá)式

發(fā)布時間:2021-04-06 17:14:51 來源:億速云 閱讀:279 作者:Leah 欄目:編程語言

這期內(nèi)容當(dāng)中小編將會給大家?guī)碛嘘P(guān)如何在c++11中使用regex正則表達(dá)式,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。

regex庫中涉及到的主要類型有:

  • 以std::string為代表的處理字符串的類型(我們知道還有存儲wchar_t的wstring類、原生c式字符串const char*等等,為了簡化處理僅介紹std::string類型相關(guān)的操作,當(dāng)你把握住了regex的主脈絡(luò)之后,想使用其他的版本只要類比就可以)

  • std::regex類,該類型需要一個代表正則表達(dá)式的字符串和一個文法選項(xiàng)作為輸入,當(dāng)文法選項(xiàng)不提供時默認(rèn)為ECMAScript。

  • std::match_results類,該類用來記錄匹配的結(jié)果,這是一個模板類,該類的模板參數(shù)是一個迭代器類型,對于std::string來說我們定義了smatch作為match_results<string::const_iterator>作為別名。

  • std::sub_match類,該類其實(shí)封裝了兩個迭代器,第一個代表開始部分,第二個代表結(jié)束部分,就像你用兩個下表索引去表達(dá)一個字符串的某一個子串一樣。這個類就是通過這樣的方式提供原字符串的某一個子串作為結(jié)果。實(shí)際上match_results中就封裝了一些std::sub_match類型的對象。(為什么是一些而不是一個,因?yàn)橐淮纹ヅ淇赡軙a(chǎn)生多個結(jié)果返回,regex認(rèn)為每個括號對構(gòu)成一個子匹配項(xiàng),regex匹配的結(jié)果可以顯式每個子匹配項(xiàng)匹配到的內(nèi)容。)

  • 現(xiàn)在我們有了表達(dá)字符串的類,表達(dá)正則匹配的類,表達(dá)匹配結(jié)果的類,接下來regex提供三個匹配函數(shù):

bool std::regex_match(...)
bool std::regex_search(...)
string std::regex_replace(...)//實(shí)際上返回類型是根據(jù)你輸入的數(shù)據(jù)類型對應(yīng)的basic_string類。

首先說明三個函數(shù)功能上的不同,std::regex_match是全文匹配,即它希望你輸入的字符串要和正則表達(dá)式全部匹配,才認(rèn)為匹配成功,否則匹配失敗,而std::regex_search是在你輸入的字符串中不斷搜索符合正則表達(dá)式描述的子字符串,然后將第一個匹配到的子字符串返回。std::regex_replace是在std::regex_search的基礎(chǔ)上更進(jìn)一步,可以將匹配的子字符串替換為你提供的字符串。

看幾個例子:

#include <iostream>
#include <string>
#include <regex>

int main() {
 std::regex pattern("\\d{4}");
 std::string content("hello_2018");
 std::smatch result;
 if (std::regex_match(content, result, pattern)) {
 std::cout << result[0];
 }
 system("pause");
 return 0;
}

匹配失敗,什么都不會輸出。

這里說明一下為什么輸出的是result[0],其實(shí)result[0]返回的就是一個sub_match類型的對象。regex中認(rèn)為正則表達(dá)式的每個括號對構(gòu)成一個子匹配項(xiàng),并認(rèn)為整個字符串作為0號子匹配項(xiàng),然后根據(jù)左括號出現(xiàn)的位置,從1號開始編號,因此返回的result[0]就是匹配整個正則表達(dá)式的字符串。

#include <iostream>
#include <string>
#include <regex>

int main() {
 std::regex pattern("\\d{4}");
 std::string content("hello_2018 by_2017");
 std::smatch result;
 if (std::regex_search(content, result, pattern)) {
 std::cout << result[0];
 }
 system("pause");
 return 0;
}

搜索到第一個符合正則表達(dá)式的子串,輸出 2018。

#include <iostream>
#include <string>
#include <regex>

int main() {
 std::regex pattern("\\d{4}");
 std::string content("hello_2018 by_2017");
 std::smatch result;

 auto begin = content.cbegin();
 auto end = content.cend();
 while (std::regex_search(begin, end, result, pattern)) {
 std::cout << result[0] << " ";
 begin = result[0].second;
 }
 system("pause");
 return 0;
}

用上述方式可以輸出字符串中所有符合正則表達(dá)式匹配要求的字符串,輸出 2018 2017。

#include <iostream>
#include <string>
#include <regex>

int main() {
 std::regex pattern("\\d{4}");
 std::string content("hello_2018 by_2017");

 std::string result = std::regex_replace(content, pattern, "everyone");
 std::cout << result;
 system("pause");
 return 0;
}

輸出 hello_everyone by_everyone。

上述就是小編為大家分享的如何在c++11中使用regex正則表達(dá)式了,如果剛好有類似的疑惑,不妨參照上述分析進(jìn)行理解。如果想知道更多相關(guān)知識,歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI