溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

易語(yǔ)言如何使用正則采集百度知道

發(fā)布時(shí)間:2021-08-18 11:29:37 來(lái)源:億速云 閱讀:163 作者:小新 欄目:編程語(yǔ)言

小編給大家分享一下易語(yǔ)言如何使用正則采集百度知道,相信大部分人都還不怎么了解,因此分享這篇文章給大家參考一下,希望大家閱讀完這篇文章后大有收獲,下面讓我們一起去了解一下吧!

常量數(shù)據(jù)表

.版本 2
.常量 標(biāo)題, "<文本長(zhǎng)度: 25>", , "ti"((\r\n|\s*).*>.*)</a>
.常量 標(biāo)題需替換的內(nèi)容, "<文本長(zhǎng)度: 17>", , target="_blank">
.常量 提問(wèn)時(shí)間, "<文本長(zhǎng)度: 36>", , "mr-8">(\d{4,}-\d{1,}-\d{1,})</span>
.常量 帖子鏈接與回答數(shù)量, "<文本長(zhǎng)度: 93>", , <a href="(http:.*)" rel="external nofollow" target="_blank" class="f-light nod" data-   log="pos:ans,si:\d{1,}">(.*)</a>
.常量 回答內(nèi)容, "<文本長(zhǎng)度: 40>", , <i class="i-answer-text">答:</i>.*</dd>
.常量 回答內(nèi)容需替換的, "<文本長(zhǎng)度: 25>", , <i class="i-answer-text">
.常量 回答者, "<文本長(zhǎng)度: 27>", , 回答者:<a href=.*>(.*)</a>

百度知道采集器

此功能需要加載精易模塊5.6

.版本 2
.支持庫(kù) iext
.程序集 窗口程序集1
.程序集變量 搜索的內(nèi)容, 文本型
.程序集變量 網(wǎng)頁(yè)源碼, 文本型
.程序集變量 頁(yè)碼變量, 整數(shù)型
.程序集變量 網(wǎng)址, 文本型
.子程序 _按鈕_搜索_被單擊
.局部變量 i, 整數(shù)型
.局部變量 i2, 整數(shù)型
.局部變量 i3, 整數(shù)型
.如果 (編輯框_搜索內(nèi)容.內(nèi)容 ≠ “”)
  超級(jí)列表框1.全部刪除 ()
  .判斷循環(huán)首 (頁(yè)碼變量 < 21)
    搜索內(nèi)容 ()
    正則 ()
    頁(yè)碼變量 = 頁(yè)碼變量 + 10
  .判斷循環(huán)尾 ()
  .計(jì)次循環(huán)首 (超級(jí)列表框1.取表項(xiàng)數(shù) (), i2)
    超級(jí)列表框1.置標(biāo)題 (i2 - 1, 0, 到文本 (i2))
  .計(jì)次循環(huán)尾 ()
  頁(yè)碼變量 = 0
.否則
  信息框 (“請(qǐng)先輸入要搜索的問(wèn)題”, #信息圖標(biāo), “提示”)
  編輯框_搜索內(nèi)容.獲取焦點(diǎn) ()
.如果結(jié)束
.子程序 搜索內(nèi)容
按鈕_搜索.標(biāo)題 = “正在搜索中...”
搜索的內(nèi)容 = 編輯框_搜索內(nèi)容.內(nèi)容
網(wǎng)址 = “http://zhidao.baidu.com/search?word=” + 編碼_URL編碼 (搜索的內(nèi)容) + “&ie=gbk&site=-1&sites=0&date=0&pn=” + 到文本 (頁(yè)碼變量)
網(wǎng)頁(yè)源碼 = 網(wǎng)頁(yè)_取網(wǎng)頁(yè)源碼 (網(wǎng)址)
.子程序 正則
.局部變量 正則標(biāo)題與序號(hào), 正則表達(dá)式類
.局部變量 局_計(jì)次, 整數(shù)型
.局部變量 表項(xiàng)索引, 整數(shù)型
.局部變量 正則鏈接與回答數(shù), 正則表達(dá)式類
.局部變量 正則回答, 正則表達(dá)式類
.局部變量 正則回答時(shí)間, 正則表達(dá)式類
.局部變量 正則回答者, 正則表達(dá)式類
正則標(biāo)題與序號(hào).創(chuàng)建 (#標(biāo)題, 網(wǎng)頁(yè)源碼)
正則鏈接與回答數(shù).創(chuàng)建 (#帖子鏈接與回答數(shù)量, 網(wǎng)頁(yè)源碼)
正則回答.創(chuàng)建 (#回答內(nèi)容, 網(wǎng)頁(yè)源碼)
正則回答時(shí)間.創(chuàng)建 (#提問(wèn)時(shí)間, 網(wǎng)頁(yè)源碼)
正則回答者.創(chuàng)建 (#回答者, 網(wǎng)頁(yè)源碼)
.計(jì)次循環(huán)首 (正則標(biāo)題與序號(hào).取匹配數(shù)量 (), 局_計(jì)次)
  表項(xiàng)索引 = 超級(jí)列表框1.插入表項(xiàng) (, , , , , )
  超級(jí)列表框1.置標(biāo)題 (表項(xiàng)索引, 1, 文本_替換 (正則標(biāo)題與序號(hào).取子匹配文本 (局_計(jì)次, 1), , , , “>”, “”, “<em>”, “”, “</em>”, “</a>”, “<em”, “”, “</em”, “”)) ' 標(biāo)題
  .如果 (尋找文本 (正則鏈接與回答數(shù).取子匹配文本 (局_計(jì)次, 1), “html”, , 假) = -1)
    超級(jí)列表框1.置標(biāo)題 (表項(xiàng)索引, 4, “”)
  .否則
    超級(jí)列表框1.置標(biāo)題 (表項(xiàng)索引, 4, 正則鏈接與回答數(shù).取子匹配文本 (局_計(jì)次, 1)) ' 鏈接
  .如果結(jié)束
  超級(jí)列表框1.置標(biāo)題 (表項(xiàng)索引, 2, 文本_替換 (正則回答.取匹配文本 (局_計(jì)次, ), , , , #回答內(nèi)容需替換的, “”, “</i>”, “”, “<em>”, “”, “</em>”, “”, “</dd>”, “”)) ' 回答
  超級(jí)列表框1.置標(biāo)題 (表項(xiàng)索引, 3, 正則鏈接與回答數(shù).取子匹配文本 (局_計(jì)次, 2)) ' 回答的數(shù)量
  超級(jí)列表框1.置標(biāo)題 (表項(xiàng)索引, 5, 正則回答時(shí)間.取子匹配文本 (局_計(jì)次, 1)) ' 回答的時(shí)間
.計(jì)次循環(huán)尾 ()
按鈕_搜索.標(biāo)題 = “搜索答案”
.子程序 _超級(jí)列表框1_被雙擊, 邏輯型
.參數(shù) 橫向位置, 整數(shù)型
.參數(shù) 縱向位置, 整數(shù)型
.參數(shù) 功能鍵狀態(tài), 整數(shù)型
_預(yù)覽此內(nèi)容_被選擇 ()
.子程序 _預(yù)覽此內(nèi)容_被選擇
.如果真 (信息框 (_啟動(dòng)窗口.超級(jí)列表框1.取標(biāo)題 (_啟動(dòng)窗口.超級(jí)列表框1.現(xiàn)行選中項(xiàng), 2) + #換行符 + “-------------------------------” + #換行符 + “是否瀏覽更多回答?”, #是否鈕 + #詢問(wèn)圖標(biāo), 超級(jí)列表框1.取標(biāo)題 (超級(jí)列表框1.現(xiàn)行選中項(xiàng), 1)) = #是鈕)
  _打開此鏈接_被選擇 ()
.如果真結(jié)束
.子程序 _超級(jí)列表框1_鼠標(biāo)右鍵被按下, 邏輯型
.參數(shù) 橫向位置, 整數(shù)型
.參數(shù) 縱向位置, 整數(shù)型
.參數(shù) 功能鍵狀態(tài), 整數(shù)型
.如果真 (超級(jí)列表框1.取表項(xiàng)數(shù) () ≠ 0)
  彈出菜單 (菜單, , )
.如果真結(jié)束
.子程序 _打開此鏈接_被選擇
網(wǎng)頁(yè)_打開指定網(wǎng)址 (超級(jí)列表框1.取標(biāo)題 (超級(jí)列表框1.現(xiàn)行選中項(xiàng), 4))
.子程序 _復(fù)制回答_被選擇
.如果真 (置剪輯板文本 (超級(jí)列表框1.取標(biāo)題 (超級(jí)列表框1.現(xiàn)行選中項(xiàng), 2)) = 真)
  信息框 (“成功復(fù)制!”, #信息圖標(biāo), “復(fù)制成功”)
.如果真結(jié)束
.子程序 __啟動(dòng)窗口_創(chuàng)建完畢
頁(yè)碼變量 = 0
編輯框_搜索內(nèi)容.獲取焦點(diǎn) ()
.子程序 _復(fù)制此鏈接_被選擇
.如果真 (置剪輯板文本 (超級(jí)列表框1.取標(biāo)題 (超級(jí)列表框1.現(xiàn)行選中項(xiàng), 4)) = 真)
  信息框 (“成功復(fù)制!”, #信息圖標(biāo), “復(fù)制成功”)
.如果真結(jié)束
.子程序 _編輯框_搜索內(nèi)容_內(nèi)容被改變
.如果真 (編輯框_搜索內(nèi)容.內(nèi)容 = “”)
  頁(yè)碼變量 = 0
.如果真結(jié)束
.子程序 _編輯框_搜索內(nèi)容_按下某鍵, 邏輯型
.參數(shù) 鍵代碼, 整數(shù)型
.參數(shù) 功能鍵狀態(tài), 整數(shù)型
.如果真 (鍵代碼 = #回車鍵)
  _按鈕_搜索_被單擊 ()
.如果真結(jié)束
.子程序 _獲取更多回答_被選擇
網(wǎng)頁(yè)_打開指定網(wǎng)址 (“http://zhidao.baidu.com/search?word=” + 編碼_URL編碼 (搜索的內(nèi)容) + “&ie=gbk&site=-1&sites=0&date=0&pn=0”)
.子程序 _按鈕_關(guān)閉_被單擊
結(jié)束 ()
.子程序 _按鈕_獲取更多回答_被單擊
_獲取更多回答_被選擇 ()

運(yùn)行結(jié)果:

易語(yǔ)言如何使用正則采集百度知道

以上是“易語(yǔ)言如何使用正則采集百度知道”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI