您好,登錄后才能下訂單哦!
這篇文章主要介紹“怎么用js正則匹配html標(biāo)簽中的內(nèi)容”的相關(guān)知識(shí),小編通過(guò)實(shí)際案例向大家展示操作過(guò)程,操作方法簡(jiǎn)單快捷,實(shí)用性強(qiáng),希望這篇“怎么用js正則匹配html標(biāo)簽中的內(nèi)容”文章能幫助大家解決問(wèn)題。
一、正則表達(dá)式
是使用單個(gè)字符串來(lái)描述、匹配一系列符合某個(gè)句法規(guī)則的字符串。
簡(jiǎn)單來(lái)說(shuō),是一種匹配字符串的方法,通過(guò)一些特殊符號(hào),實(shí)現(xiàn)快速查找、刪除、替換某個(gè)特定字符串。
二、匹配方法:replace()方法
參數(shù)為正則表達(dá)式,如果找到匹配時(shí),返回匹配字符串的開(kāi)始位置,否則,返回-1;不支持全文檢索。
三、使用:匹配html標(biāo)簽中的內(nèi)容
匹配html標(biāo)簽,例如"<p>xxx</p>"這種格式
獲取html中的數(shù)據(jù)并預(yù)處理
private static Pattern HTML_TAG_PATTERN = Pattern.compile("<[a-zA-Z]+.*?>([\\s\\S]*?)</[a-zA-Z]*?>"); /** * 獲取html中的數(shù)據(jù) * @param htmlString * @return */ public static List<String> getResultsFromHtml(String htmlString) { List<String> results = new ArrayList<>(); // 數(shù)據(jù)預(yù)處理 htmlString = replaceStyle(removeBrTag(htmlString)); if (htmlString != null && htmlString.length() > 0) { Matcher imageTagMatcher = HTML_TAG_PATTERN.matcher(htmlString);
1、針對(duì)多個(gè)并列的標(biāo)簽的情況,對(duì)應(yīng)正則表達(dá)式中的圓括號(hào)括起來(lái)的數(shù)據(jù)
while (imageTagMatcher.find()) { String result = ""; // group(1) result = imageTagMatcher.group(1).trim();
2、針對(duì)多個(gè)標(biāo)簽嵌套的情況進(jìn)行處理
if (result != null && result.length() > 0) { result = replaceStartTag(result); } results.add(result); } } return results; }
關(guān)于“怎么用js正則匹配html標(biāo)簽中的內(nèi)容”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識(shí),可以關(guān)注億速云行業(yè)資訊頻道,小編每天都會(huì)為大家更新不同的知識(shí)點(diǎn)。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。