您好,登錄后才能下訂單哦!
織夢cms通過正則批量查找替換數(shù)據(jù)庫自定義內(nèi)容的方法?這個問題可能是我們?nèi)粘W(xué)習(xí)或工作經(jīng)常見到的。希望通過這個問題能讓你收獲頗深。下面是小編給大家?guī)淼膮⒖純?nèi)容,讓我們一起來看看吧!
織夢cms如何通過正則批量查找替換數(shù)據(jù)庫的自定義內(nèi)容?
正則的表達式在MY SQL中也有應(yīng)用,但是在具體將查找的東西直接進行Replace的時候目前還不能解決,幸好后臺中有個dede利用正則,利用dede正則批量替換數(shù)據(jù)庫中內(nèi)容,這樣我們完全減小了自己的工作量了
推薦學(xué)習(xí):織夢cms
例如網(wǎng)站的一個例子
是替換一個div中的內(nèi)容,摘抄實踐下,關(guān)鍵還是自己去體會,多用下正則,還是不錯的、正則相關(guān)的文章我在我的博客中也多次提到了他的多種運用途徑。如果你都掌握好它的話,你的工作效率就會成倍的提高了。
下面這個正則的用途是查找數(shù)據(jù)庫的中自定義的DIV層中運用,一般這種用法你在采集,或者,用word直接添加內(nèi)容后會用到。
看看這個是如何去除的。
例子一,去除簡單自定義內(nèi)容內(nèi)容
選擇數(shù)據(jù)表與字段:dede_addonarticle
替換方式:選擇正則表達式
主鍵字段:aid
被替換內(nèi)容:MM[\d]*GG
選擇字段:body(這表是存儲文章內(nèi)容的),選擇單選框:正則表達式,主鍵字段填寫"aid",被替換內(nèi)容為上面的正則:
例:MM[\d]*GG
替換為:可為空,也可填寫你想置換為的內(nèi)容。
替換條件:如果是全部,就不填寫。開始測試時,先備份了數(shù)據(jù)庫,然后僅替換一篇文章,條件中填寫:aid=888,如果是分類,就填寫:typeid=18,這樣縮小替換范圍,避免出錯。
填寫安全確認碼,替換就ok了,
例子二,去除<div style="*">*</div>內(nèi)容
<div style="background-color: #fff9ee; text-align: center"><font style="font-weight: bold;">文章地址址:<br />//www.jb51.net/<br /></font> </div>
上述代碼,是一個不錯的style,大家可以顯示下,調(diào)試效果不錯。
可以利用以下正則來替換:
<div style=\"[^>]*\">(.*)</font> </div>
在dede后臺,選擇:核心–數(shù)據(jù)庫內(nèi)容替換–選擇表:
選擇數(shù)據(jù)表與字段:dede_addonarticle
替換方式:選擇正則表達式
主鍵字段:aid
被替換內(nèi)容:<div style=\"[^>]*\">(.*)</font> </div>
選擇字段:body(這表是存儲文章內(nèi)容的),選擇單選框:正則表達式,主鍵字段填寫"aid",被替換內(nèi)容為上面的正則:
例:<div style=\"[^>]*\">(.*)</font> </div>
替換為:可為空,也可填寫你想置換為的內(nèi)容。
替換條件:如果是全部,就不填寫。
注意:開始測試時,先備份了數(shù)據(jù)庫,然后僅替換一篇文章,條件中填寫:aid=8880,如果是分類,就填寫:typeid=18,這樣縮
小替換范圍,避免出錯。
填寫安全確認碼,替換就ok了,注意這個安全確認碼會有失效周期,但它自己不提示,也有這個可能,會選擇替換無反應(yīng),遇見
這情況,只有刷新當前頁面了。
很完整了吧!其它正則參考:http://bbs.dedecms.com/214856.html,這個當中的也不完整,也不太正確,需要對比來修改調(diào)試
,很費時間。
正則是個好技術(shù),有著很強大的應(yīng)用,花了點時間看,你的工作效果會大陪的提高!
這是我在處理文章時用到一些正則表達式,里面有你要的。在Editplus中使用。
在表:dede_addonarticle中,body字段即是文章內(nèi)容。
過濾Table相關(guān)的:
<table([^>]*)>|</table>|<td>|</td>|<tbody>|</tbody>|<tr>|</tr>
正則: width=\"[0-9][0-9][0-9]\"| width=[0-9][0-9][0-9]| height=\"[0-9][0-9][0-9]\"| height=[0-9][0-9][0-9],
說明:過慮height、Width。
正則:<div style=\"[^>]*\">|<div [^>]*>|</div>|<div>,注意:匹配<div style="">或者<div id="">。
正則: style=\"[^"]*\"| style=[^"]*,注意:匹配Style="border:"
正則:<style([^>]*)>(.*)</style> ,注意:匹配<style type="text/css"></style>
正則:<font [^>]*>|<font>|</font>|<strong [^>]*>|<strong>|</strong> ,注意:匹配<font>和<strong>
正則: border="[0-9]"| border=[0-9],注意:匹配border=""
正則:<span [^>]*>|<span>|</span> ,注意:匹配<span>
正則: id=[^ ]*| id=\"[^ ]*\",注意:匹配id=""
正則: title=[0-9][^ ]*| title=\"[0-9][^ ]*\"| alt=[0-9][^ ]*| alt=\"[0-9][^ ]*\"| alt=[a-z][^ ]*| alt=\"[a
-z][^ ]*\",注意:匹配Title或者alt
正則:<!–[^>]*–>,說明:匹配HTML注釋
正則:<script([^>]*)>(.*)</script>,說明:匹配<script></script>之間的全部內(nèi)容
正則: class=[a-z][^ |^>]*| class=\"[a-z][^ |^>]*\",說明:清理class="",經(jīng)過充分測試
正則:<table([^>]*)>|</table>|<td>|</td>|<tbody>|</tbody>|<tr>|</tr>
正則:<h3 [^>]*>|<h3>|</h3>| align=left|<em>|</em>|<center>|</center>|<a([^>]*)>|</a>
正則表達式是一種通用的標準,大部分計算機語言都支持正則表達式,包括as3,這里轉(zhuǎn)摘出了一些常用的正則表達式語句,大家用到的時候就不用自己寫了
^[0-9]*[1-9][0-9]*$ //匹配正整數(shù)
^-[0-9]*[1-9][0-9]*$ //匹配負整數(shù)
^-?\d+$ //匹配整數(shù)
^\d+(\.\d+)?$ //匹配非負浮點數(shù)(正浮點數(shù) + 0)
^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$ //匹配正浮點數(shù)
^((-\d+(\.\d+)?)|(0+(\.0+)?))$ //匹配非正浮點數(shù)(負浮點數(shù) + 0)
^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$ //匹配負浮點數(shù)
^(-?\d+)(\.\d+)?$ //匹配浮點數(shù)
^[A-Za-z]+$ //匹配由26個英文字母組成的字符串
^[A-Z]+$ //匹配由26個英文字母的大寫組成的字符串
^[a-z]+$ //匹配由26個英文字母的小寫組成的字符串
^[A-Za-z0-9]+$ //匹配由數(shù)字和26個英文字母組成的字符串
^\w+$ //匹配由數(shù)字、26個英文字母或者下劃線組成的字符串
^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$ //匹配email地址
^[a-zA-z]+://匹配(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$ //匹配url
匹配中文字符的正則表達式: [\u4e00-\u9fa5]
匹配雙字節(jié)字符(包括漢字在內(nèi)):[^\x00-\xff]
匹配空行的正則表達式:\n[\s| ]*\r
匹配HTML標記的正則表達式:/<(.*)>.*<\/>|<(.*) \/>/
匹配首尾空格的正則表達式:(^\s*)|(\s*$)
匹配Email地址的正則表達式:\w+([-+.]\w+)*@\w+([-.]\w+)*\.\w+([-.]\w+)*
匹配網(wǎng)址URL的正則表達式:^[a-zA-z]+://(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$
匹配帳號是否合法(字母開頭,允許5-16字節(jié),允許字母數(shù)字下劃線):^[a-zA-Z][a-zA-Z0-9_]{4,15}$
匹配國內(nèi)電話號碼:(\d{3}-|\d{4}-)?(\d{8}|\d{7})?
匹配騰訊QQ號:^[1-9]*[1-9][0-9]*$
下表是元字符及其在正則表達式上下文中的行為的一個完整列表:
\ 將下一個字符標記為一個特殊字符、或一個原義字符、或一個后向引用、或一個八進制轉(zhuǎn)義符。
^ 匹配輸入字符串的開始位置。如果設(shè)置了 RegExp 對象的Multiline 屬性,^ 也匹配 '\n' 或 '\r' 之后的位置。
$ 匹配輸入字符串的結(jié)束位置。如果設(shè)置了 RegExp 對象的Multiline 屬性,$ 也匹配 '\n' 或 '\r' 之前的位置。
* 匹配前面的子表達式零次或多次。
+ 匹配前面的子表達式一次或多次。+ 等價于 {1,}。
? 匹配前面的子表達式零次或一次。? 等價于 {0,1}。
{n} n 是一個非負整數(shù),匹配確定的n 次。
{n,} n 是一個非負整數(shù),至少匹配n 次。
{n,m} m 和 n 均為非負整數(shù),其中n <= m。最少匹配 n 次且最多匹配 m 次。在逗號和兩個數(shù)之間不能有空格。
? 當該字符緊跟在任何一個其他限制符 (*, +, ?, {n}, {n,}, {n,m}) 后面時,匹配模式是非貪婪的。非貪婪模式盡可能少的匹
配所搜索的字符串,而默認的貪婪模式則盡可能多的匹配所搜索的字符串。
. 匹配除 "\n" 之外的任何單個字符。要匹配包括 '\n' 在內(nèi)的任何字符,請使用象 '[.\n]' 的模式。
(pattern) 匹配pattern 并獲取這一匹配。
(?:pattern) 匹配pattern 但不獲取匹配結(jié)果,也就是說這是一個非獲取匹配,不進行存儲供以后使用。
(?=pattern) 正向預(yù)查,在任何匹配 pattern 的字符串開始處匹配查找字符串。這是一個非獲取匹配,也就是說,該匹配不需要
獲取供以后使用。
(?!pattern) 負向預(yù)查,與(?=pattern)作用相反
x|y 匹配 x 或 y。
[xyz] 字符集合。
[^xyz] 負值字符集合。
[a-z] 字符范圍,匹配指定范圍內(nèi)的任意字符。
[^a-z] 負值字符范圍,匹配任何不在指定范圍內(nèi)的任意字符。
\b 匹配一個單詞邊界,也就是指單詞和空格間的位置。
\B 匹配非單詞邊界。
\cx 匹配由x指明的控制字符。
\d 匹配一個數(shù)字字符。等價于 [0-9]。
\D 匹配一個非數(shù)字字符。等價于 [^0-9]。
\f 匹配一個換頁符。等價于 \x0c 和 \cL。
\n 匹配一個換行符。等價于 \x0a 和 \cJ。
\r 匹配一個回車符。等價于 \x0d 和 \cM。
\s 匹配任何空白字符,包括空格、制表符、換頁符等等。等價于[ \f\n\r\t\v]。
\S 匹配任何非空白字符。等價于 [^ \f\n\r\t\v]。
\t 匹配一個制表符。等價于 \x09 和 \cI。
\v 匹配一個垂直制表符。等價于 \x0b 和 \cK。
\w 匹配包括下劃線的任何單詞字符。等價于'[A-Za-z0-9_]'。
\W 匹配任何非單詞字符。等價于 '[^A-Za-z0-9_]'。
\xn 匹配 n,其中 n 為十六進制轉(zhuǎn)義值。十六進制轉(zhuǎn)義值必須為確定的兩個數(shù)字長。
\num 匹配 num,其中num是一個正整數(shù)。對所獲取的匹配的引用。
\n 標識一個八進制轉(zhuǎn)義值或一個后向引用。如果 \n 之前至少 n 個獲取的子表達式,則 n 為后向引用。否則,如果 n 為八進
制數(shù)字 (0-7),則 n 為一個八進制轉(zhuǎn)義值。
\nm 標識一個八進制轉(zhuǎn)義值或一個后向引用。如果 \nm 之前至少有is preceded by at least nm 個獲取得子表達式,則 nm 為
后向引用。如果 \nm 之前至少有 n 個獲取,則 n 為一個后跟文字 m 的后向引用。如果前面的條件都不滿足,若 n 和 m 均為
八進制數(shù)字 (0-7),則 \nm 將匹配八進制轉(zhuǎn)義值 nm。
\nml 如果 n 為八進制數(shù)字 (0-3),且 m 和 l 均為八進制數(shù)字 (0-7),則匹配八
關(guān)于批量替換 正則表達式
這是我在處理文章時用到一些正則表達式,里面有你要的。在Editplus中使用。
在表:dede_addonarticle中,body字段即是文章內(nèi)容。
過濾Table相關(guān)的:
<table([^>]*)>|</table>|<td>|</td>|<tbody>|</tbody>|<tr>|</tr>
還有一些,可供你參考,我加了一些注釋,發(fā)個貼太累了,哎~~~自己摸索吧:
正則: width=\"[0-9][0-9][0-9]\"| width=[0-9][0-9][0-9]| height=\"[0-9][0-9][0-9]\"| height=[0-9][0-9][0-9],說明:過慮height、Width。
------------------------------------------------------
正則:<div style=\"[^>]*\">|<div [^>]*>|</div>|<div>,注意:匹配<div style="">或者<div id="">。
------------------------------------------------------
正則: style=\"[^"]*\"| style=[^"]*,注意:匹配Style="border:"
------------------------------------------------------
正則:<style([^>]*)>(.*)</style> ,注意:匹配<style type="text/css"></style>
------------------------------------------------------
正則:<font [^>]*>|<font>|</font>|<strong [^>]*>|<strong>|</strong> ,注意:匹配<font>和<strong>
------------------------------------------------------
正則: border="[0-9]"| border=[0-9],注意:匹配border=""
------------------------------------------------------
正則:<span [^>]*>|<span>|</span> ,注意:匹配<span>
------------------------------------------------------
正則: id=[^ ]*| id=\"[^ ]*\",注意:匹配id=“”
------------------------------------------------------
正則: title=[0-9][^ ]*| title=\"[0-9][^ ]*\"| alt=[0-9][^ ]*| alt=\"[0-9][^ ]*\"| alt=[a-z][^ ]*| alt=\"[a-z][^ ]*\",注意:匹配Title或者alt
------------------------------------------------------
正則:<!--[^>]*-->,說明:匹配HTML注釋
------------------------------------------------------
正則:<script([^>]*)>(.*)</script>,說明:匹配<script></script>之間的全部內(nèi)容
------------------------------------------------------
正則: class=[a-z][^ |^>]*| class=\"[a-z][^ |^>]*\",說明:清理class="",經(jīng)過充分測試
------------------------------------------------------
正則:<table([^>]*)>|</table>|<td>|</td>|<tbody>|</tbody>|<tr>|</tr>
------------------------------------------------------
正則:<h3 [^>]*>|<h3>|</h3>| align=left|<em>|</em>|<center>|</center>|<a([^>]*)>|</a>
感謝各位的閱讀!看完上述內(nèi)容,你們對織夢cms通過正則批量查找替換數(shù)據(jù)庫自定義內(nèi)容的方法大概了解了嗎?希望文章內(nèi)容對大家有所幫助。如果想了解更多相關(guān)文章內(nèi)容,歡迎關(guān)注億速云行業(yè)資訊頻道。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。