您好,登錄后才能下訂單哦!
本文實例為大家分享了java抓取郵箱號碼的具體代碼,供大家參考,具體內(nèi)容如下
java抓取文件中郵箱號碼的具體代碼
package reg; import java.io.BufferedReader; import java.io.FileNotFoundException; import java.io.FileReader; import java.io.IOException; import java.util.ArrayList; import java.util.List; import java.util.regex.Matcher; import java.util.regex.Pattern; public class TestEmail { public static void main(String[] args) { // TODO Auto-generated method stub BufferedReader br=null; try { br=new BufferedReader(new FileReader("D:/1.htm")); String str=null; StringBuilder sb=new StringBuilder(); while((str=br.readLine())!=null){ sb.append(str); } List es=getEmail(sb.toString()); for(String e:es){ System.out.println(e); } } catch (FileNotFoundException e) { // TODO: handle exception e.printStackTrace(); }catch (IOException e) { // TODO: handle exception e.printStackTrace(); }finally { try { if(br!=null) br.close(); } catch (IOException e) { // TODO: handle exception e.printStackTrace(); } } } public static List getEmail(String str){ List es=new ArrayList(); Pattern p=Pattern.compile("[\\w\\.-]*\\w+@[\\w\\.-]*\\w+\\.\\w{2,5}"); // Pattern p=Pattern.compile("[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+"); Matcher m=p.matcher(str); while(m.find()){ es.add(m.group()); } return es; } }
java抓取網(wǎng)頁中郵箱號碼的具體代碼
package reg; import java.io.BufferedReader; import java.io.InputStreamReader; import java.util.regex.Matcher; import java.util.regex.Pattern; public class Testemail01 { public static String getWebCon(String domain) { System.out.println("開始抓取郵件地址..("+domain+")"); StringBuffer sb=new StringBuffer(); try { java.net.URL url=new java.net.URL(domain); BufferedReader in=new BufferedReader(new InputStreamReader(url.openStream())); String line; while((line=in.readLine())!=null) { parse(line); } in.close(); } catch(Exception e) { sb.append(e.toString()); System.err.println(e); } return sb.toString(); } public static void main(String[] args) { String s=Testemail01.getWebCon("http://tieba.baidu.com/p/2366935784"); } private static void parse(String line) { Pattern p=Pattern.compile("[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+");//郵箱的正則表達(dá)式 Matcher m=p.matcher(line); while(m.find()) { System.out.println(m.group()); } } }
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持億速云。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。