您好,登錄后才能下訂單哦!
小編給大家分享一下易語(yǔ)言如何使用正則采集百度知道,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!
常量數(shù)據(jù)表
.版本 2 .常量 標(biāo)題, "<文本長(zhǎng)度: 25>", , "ti"((\r\n|\s*).*>.*)</a> .常量 標(biāo)題需替換的內(nèi)容, "<文本長(zhǎng)度: 17>", , target="_blank"> .常量 提問(wèn)時(shí)間, "<文本長(zhǎng)度: 36>", , "mr-8">(\d{4,}-\d{1,}-\d{1,})</span> .常量 帖子鏈接與回答數(shù)量, "<文本長(zhǎng)度: 93>", , <a href="(http:.*)" rel="external nofollow" target="_blank" class="f-light nod" data- log="pos:ans,si:\d{1,}">(.*)</a> .常量 回答內(nèi)容, "<文本長(zhǎng)度: 40>", , <i class="i-answer-text">答:</i>.*</dd> .常量 回答內(nèi)容需替換的, "<文本長(zhǎng)度: 25>", , <i class="i-answer-text"> .常量 回答者, "<文本長(zhǎng)度: 27>", , 回答者:<a href=.*>(.*)</a>
百度知道采集器
此功能需要加載精易模塊5.6
.版本 2 .支持庫(kù) iext .程序集 窗口程序集1 .程序集變量 搜索的內(nèi)容, 文本型 .程序集變量 網(wǎng)頁(yè)源碼, 文本型 .程序集變量 頁(yè)碼變量, 整數(shù)型 .程序集變量 網(wǎng)址, 文本型 .子程序 _按鈕_搜索_被單擊 .局部變量 i, 整數(shù)型 .局部變量 i2, 整數(shù)型 .局部變量 i3, 整數(shù)型 .如果 (編輯框_搜索內(nèi)容.內(nèi)容 ≠ “”) 超級(jí)列表框1.全部刪除 () .判斷循環(huán)首 (頁(yè)碼變量 < 21) 搜索內(nèi)容 () 正則 () 頁(yè)碼變量 = 頁(yè)碼變量 + 10 .判斷循環(huán)尾 () .計(jì)次循環(huán)首 (超級(jí)列表框1.取表項(xiàng)數(shù) (), i2) 超級(jí)列表框1.置標(biāo)題 (i2 - 1, 0, 到文本 (i2)) .計(jì)次循環(huán)尾 () 頁(yè)碼變量 = 0 .否則 信息框 (“請(qǐng)先輸入要搜索的問(wèn)題”, #信息圖標(biāo), “提示”) 編輯框_搜索內(nèi)容.獲取焦點(diǎn) () .如果結(jié)束 .子程序 搜索內(nèi)容 按鈕_搜索.標(biāo)題 = “正在搜索中...” 搜索的內(nèi)容 = 編輯框_搜索內(nèi)容.內(nèi)容 網(wǎng)址 = “http://zhidao.baidu.com/search?word=” + 編碼_URL編碼 (搜索的內(nèi)容) + “&ie=gbk&site=-1&sites=0&date=0&pn=” + 到文本 (頁(yè)碼變量) 網(wǎng)頁(yè)源碼 = 網(wǎng)頁(yè)_取網(wǎng)頁(yè)源碼 (網(wǎng)址) .子程序 正則 .局部變量 正則標(biāo)題與序號(hào), 正則表達(dá)式類 .局部變量 局_計(jì)次, 整數(shù)型 .局部變量 表項(xiàng)索引, 整數(shù)型 .局部變量 正則鏈接與回答數(shù), 正則表達(dá)式類 .局部變量 正則回答, 正則表達(dá)式類 .局部變量 正則回答時(shí)間, 正則表達(dá)式類 .局部變量 正則回答者, 正則表達(dá)式類 正則標(biāo)題與序號(hào).創(chuàng)建 (#標(biāo)題, 網(wǎng)頁(yè)源碼) 正則鏈接與回答數(shù).創(chuàng)建 (#帖子鏈接與回答數(shù)量, 網(wǎng)頁(yè)源碼) 正則回答.創(chuàng)建 (#回答內(nèi)容, 網(wǎng)頁(yè)源碼) 正則回答時(shí)間.創(chuàng)建 (#提問(wèn)時(shí)間, 網(wǎng)頁(yè)源碼) 正則回答者.創(chuàng)建 (#回答者, 網(wǎng)頁(yè)源碼) .計(jì)次循環(huán)首 (正則標(biāo)題與序號(hào).取匹配數(shù)量 (), 局_計(jì)次) 表項(xiàng)索引 = 超級(jí)列表框1.插入表項(xiàng) (, , , , , ) 超級(jí)列表框1.置標(biāo)題 (表項(xiàng)索引, 1, 文本_替換 (正則標(biāo)題與序號(hào).取子匹配文本 (局_計(jì)次, 1), , , , “>”, “”, “<em>”, “”, “</em>”, “</a>”, “<em”, “”, “</em”, “”)) ' 標(biāo)題 .如果 (尋找文本 (正則鏈接與回答數(shù).取子匹配文本 (局_計(jì)次, 1), “html”, , 假) = -1) 超級(jí)列表框1.置標(biāo)題 (表項(xiàng)索引, 4, “”) .否則 超級(jí)列表框1.置標(biāo)題 (表項(xiàng)索引, 4, 正則鏈接與回答數(shù).取子匹配文本 (局_計(jì)次, 1)) ' 鏈接 .如果結(jié)束 超級(jí)列表框1.置標(biāo)題 (表項(xiàng)索引, 2, 文本_替換 (正則回答.取匹配文本 (局_計(jì)次, ), , , , #回答內(nèi)容需替換的, “”, “</i>”, “”, “<em>”, “”, “</em>”, “”, “</dd>”, “”)) ' 回答 超級(jí)列表框1.置標(biāo)題 (表項(xiàng)索引, 3, 正則鏈接與回答數(shù).取子匹配文本 (局_計(jì)次, 2)) ' 回答的數(shù)量 超級(jí)列表框1.置標(biāo)題 (表項(xiàng)索引, 5, 正則回答時(shí)間.取子匹配文本 (局_計(jì)次, 1)) ' 回答的時(shí)間 .計(jì)次循環(huán)尾 () 按鈕_搜索.標(biāo)題 = “搜索答案” .子程序 _超級(jí)列表框1_被雙擊, 邏輯型 .參數(shù) 橫向位置, 整數(shù)型 .參數(shù) 縱向位置, 整數(shù)型 .參數(shù) 功能鍵狀態(tài), 整數(shù)型 _預(yù)覽此內(nèi)容_被選擇 () .子程序 _預(yù)覽此內(nèi)容_被選擇 .如果真 (信息框 (_啟動(dòng)窗口.超級(jí)列表框1.取標(biāo)題 (_啟動(dòng)窗口.超級(jí)列表框1.現(xiàn)行選中項(xiàng), 2) + #換行符 + “-------------------------------” + #換行符 + “是否瀏覽更多回答?”, #是否鈕 + #詢問(wèn)圖標(biāo), 超級(jí)列表框1.取標(biāo)題 (超級(jí)列表框1.現(xiàn)行選中項(xiàng), 1)) = #是鈕) _打開此鏈接_被選擇 () .如果真結(jié)束 .子程序 _超級(jí)列表框1_鼠標(biāo)右鍵被按下, 邏輯型 .參數(shù) 橫向位置, 整數(shù)型 .參數(shù) 縱向位置, 整數(shù)型 .參數(shù) 功能鍵狀態(tài), 整數(shù)型 .如果真 (超級(jí)列表框1.取表項(xiàng)數(shù) () ≠ 0) 彈出菜單 (菜單, , ) .如果真結(jié)束 .子程序 _打開此鏈接_被選擇 網(wǎng)頁(yè)_打開指定網(wǎng)址 (超級(jí)列表框1.取標(biāo)題 (超級(jí)列表框1.現(xiàn)行選中項(xiàng), 4)) .子程序 _復(fù)制回答_被選擇 .如果真 (置剪輯板文本 (超級(jí)列表框1.取標(biāo)題 (超級(jí)列表框1.現(xiàn)行選中項(xiàng), 2)) = 真) 信息框 (“成功復(fù)制!”, #信息圖標(biāo), “復(fù)制成功”) .如果真結(jié)束 .子程序 __啟動(dòng)窗口_創(chuàng)建完畢 頁(yè)碼變量 = 0 編輯框_搜索內(nèi)容.獲取焦點(diǎn) () .子程序 _復(fù)制此鏈接_被選擇 .如果真 (置剪輯板文本 (超級(jí)列表框1.取標(biāo)題 (超級(jí)列表框1.現(xiàn)行選中項(xiàng), 4)) = 真) 信息框 (“成功復(fù)制!”, #信息圖標(biāo), “復(fù)制成功”) .如果真結(jié)束 .子程序 _編輯框_搜索內(nèi)容_內(nèi)容被改變 .如果真 (編輯框_搜索內(nèi)容.內(nèi)容 = “”) 頁(yè)碼變量 = 0 .如果真結(jié)束 .子程序 _編輯框_搜索內(nèi)容_按下某鍵, 邏輯型 .參數(shù) 鍵代碼, 整數(shù)型 .參數(shù) 功能鍵狀態(tài), 整數(shù)型 .如果真 (鍵代碼 = #回車鍵) _按鈕_搜索_被單擊 () .如果真結(jié)束 .子程序 _獲取更多回答_被選擇 網(wǎng)頁(yè)_打開指定網(wǎng)址 (“http://zhidao.baidu.com/search?word=” + 編碼_URL編碼 (搜索的內(nèi)容) + “&ie=gbk&site=-1&sites=0&date=0&pn=0”) .子程序 _按鈕_關(guān)閉_被單擊 結(jié)束 () .子程序 _按鈕_獲取更多回答_被單擊 _獲取更多回答_被選擇 ()
運(yùn)行結(jié)果:
以上是“易語(yǔ)言如何使用正則采集百度知道”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。