溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

Java項目中的HTML標(biāo)簽怎么使用正則表達(dá)式進(jìn)行刪除

發(fā)布時間:2020-11-21 15:52:00 來源:億速云 閱讀:223 作者:Leah 欄目:編程語言

這篇文章給大家介紹Java項目中的HTML標(biāo)簽怎么使用正則表達(dá)式進(jìn)行刪除,內(nèi)容非常詳細(xì),感興趣的小伙伴們可以參考借鑒,希望對大家能有所幫助。

具體如下:

package com.xz.cxzy.utils;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class HtmlUtil {
  private static final String regEx_script = "<script[^>]*&#63;>[\\s\\S]*&#63;<\\/script>"; // 定義script的正則表達(dá)式
  private static final String regEx_style = "<style[^>]*&#63;>[\\s\\S]*&#63;<\\/style>"; // 定義style的正則表達(dá)式
  private static final String regEx_html = "<[^>]+>"; // 定義HTML標(biāo)簽的正則表達(dá)式
  private static final String regEx_space = "\\s*|\t|\r|\n";//定義空格回車換行符
  /**
   * @param htmlStr
   * @return
   * 刪除Html標(biāo)簽
   */
  public static String delHTMLTag(String htmlStr) {
    Pattern p_script = Pattern.compile(regEx_script, Pattern.CASE_INSENSITIVE);
    Matcher m_script = p_script.matcher(htmlStr);
    htmlStr = m_script.replaceAll(""); // 過濾script標(biāo)簽
    Pattern p_style = Pattern.compile(regEx_style, Pattern.CASE_INSENSITIVE);
    Matcher m_style = p_style.matcher(htmlStr);
    htmlStr = m_style.replaceAll(""); // 過濾style標(biāo)簽
    Pattern p_html = Pattern.compile(regEx_html, Pattern.CASE_INSENSITIVE);
    Matcher m_html = p_html.matcher(htmlStr);
    htmlStr = m_html.replaceAll(""); // 過濾html標(biāo)簽
    Pattern p_space = Pattern.compile(regEx_space, Pattern.CASE_INSENSITIVE);
    Matcher m_space = p_space.matcher(htmlStr);
    htmlStr = m_space.replaceAll(""); // 過濾空格回車標(biāo)簽
    return htmlStr.trim(); // 返回文本字符串
  }
  public static String getTextFromHtml(String htmlStr){
    htmlStr = delHTMLTag(htmlStr);
    htmlStr = htmlStr.replaceAll(" ", "");
    htmlStr = htmlStr.substring(0, htmlStr.indexOf("。")+1);
    return htmlStr;
  }
  public static void main(String[] args) {
    String str = "<div style='text-align:center;'> 整治“四風(fēng)”  清弊除垢<br/><span style='font-size:14px;'> </span><span style='font-size:18px;'>公司召開黨的群眾路線教育實踐活動動員大會</span><br/></div>";
    System.out.println(getTextFromHtml(str));
  }
}

關(guān)于Java項目中的HTML標(biāo)簽怎么使用正則表達(dá)式進(jìn)行刪除就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,可以學(xué)到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI