溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

怎么用Perl抓取網(wǎng)頁和提交表格

發(fā)布時間:2021-11-30 15:55:54 來源:億速云 閱讀:107 作者:小新 欄目:編程語言

這篇文章主要介紹了怎么用Perl抓取網(wǎng)頁和提交表格,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。

用Perl抓取網(wǎng)頁和提交表格

這里簡單介紹一下用Perl來實現(xiàn)抓好取網(wǎng)頁的源代碼,以及用POST的方法來提交表格,并返回結(jié)果。難的講不來,講講簡單的。

這里講到的Perl模塊有:

useLWP::Simple;useLWP::UserAgent;用Perldoc查看詳細(xì)的用法。

1,用Perl抓取網(wǎng)頁

如果只是要拿到某個網(wǎng)頁,那使用LWP::Simple里的函數(shù)是最簡單的。通過調(diào)用get($url)函數(shù),就可以得到相關(guān)網(wǎng)址的內(nèi)容。

my$url='http://freshair.npr.org/dayFA.cfm?todayDate=current'  useLWP::Simple;  my$content=get$url;  die"Couldn'tget$url"unlessdefined$content;

#$content里是網(wǎng)頁內(nèi)容,下面是對此內(nèi)容作些分析:

if($content=~m/jazz/i){  print"They'retalkingaboutjazztodayonFreshAir!\n";  }else{  print"FreshAirisapparentlyjazzlesstoday.\n";  }

非常簡單易懂。拿網(wǎng)頁內(nèi)容是容易的,難的是用正則過濾需要的內(nèi)容。

2,通過POST提交表格

部分HTML表格使用HTMLPOST向服務(wù)器提交數(shù)據(jù),在這里你可以這樣:

$response=$browser->post($url,  [  formkey1=>value1,  formkey2=>value2,  ...  ],  );

實例分析:例如在http://www.enzim.hu/hmmtop/html/submit.html)提交一段序列并返回結(jié)果,用Perl來實現(xiàn)。代碼如下:

#!/usr/bin/Perl   useLWP::UserAgent;  my$browser=LWP::UserAgent->new;  $protein="MSSSTPFDPYALSEHDEERPQNVQSKSRTAELQAEIDDTVGIMRDNINKVAERGERLTSI";  my$SUSUI_URL="http://www.enzim.hu/hmmtop/server/hmmtop.cgi";  my$response=$browser->post($SUSUI_URL,['if'=>$protein,]);   if($response->is_success){   print$response->content;  }else{   print"Badluckthistime\n";  }

通過分析http://www.enzim.hu/hmmtop/html/submit.html的頁面可知,這個要提交的input只有一個,就是name="if"。$protein就是要提交的序列。$response->content就是返回結(jié)果。

感謝你能夠認(rèn)真閱讀完這篇文章,希望小編分享的“怎么用Perl抓取網(wǎng)頁和提交表格”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關(guān)注億速云行業(yè)資訊頻道,更多相關(guān)知識等著你來學(xué)習(xí)!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI