<acronym id="k15h5"><ol id="k15h5"></ol></acronym>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊(cè)×

獲取短信驗(yàn)證碼

其他方式登錄

點(diǎn)擊登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請(qǐng)使用微信掃描上方二維碼

使用幫助

請(qǐng)求超時(shí)！

請(qǐng)點(diǎn)擊重新獲取二維碼

Gne如何提取新聞網(wǎng)頁(yè)

發(fā)布時(shí)間：2022-01-04 10:57:41 來(lái)源：億速云閱讀：133 作者：柒染欄目：大數(shù)據(jù)

Gne如何提取新聞網(wǎng)頁(yè)，相信很多沒(méi)有經(jīng)驗(yàn)的人對(duì)此束手無(wú)策，為此本文總結(jié)了問(wèn)題出現(xiàn)的原因和解決方法，通過(guò)這篇文章希望你能解決這個(gè)問(wèn)題。

GNE^[1]是我開源的一個(gè)新聞網(wǎng)站正文通用抽取器，自發(fā)布以來(lái)得到了很多同學(xué)的好評(píng)。

一直以來(lái)，GNE 是以 Python 包的形式存在，要測(cè)試 GNE 的提取效果，需要使用 pip 先安裝，再寫代碼使用。

為了降低測(cè)試 GNE 的成本，也為了讓更多同學(xué)了解 GNE，測(cè)試 GNE，我開發(fā)了網(wǎng)頁(yè)版的 GNE——Gne Online。

打開Gne Online 的地址為：http://122.51.39.219/，打開以后的頁(yè)面如下圖所示。

Gne如何提取新聞網(wǎng)頁(yè)

要測(cè)試 GNE 的功能，你只需要在最上面的文本框中粘貼網(wǎng)頁(yè)源代碼，并點(diǎn)擊提取按鈕即可：

Gne如何提取新聞網(wǎng)頁(yè)

對(duì)于標(biāo)題、作者、新聞發(fā)布時(shí)間這種可能發(fā)送誤提取的情況，我們可以通過(guò)下面對(duì)應(yīng)的Title XPath、Author、Publish Time XPath來(lái)輸入 XPath 定向提取。例如對(duì)于今日頭條的文章：

Gne如何提取新聞網(wǎng)頁(yè)

新聞的作者提取失誤，此時(shí)可以指定 XPath：//div[@class="article-sub"]/span[1]/text()來(lái)定向提取，如下圖所示。

Gne如何提取新聞網(wǎng)頁(yè)

通過(guò)設(shè)定Host輸入框，可以在網(wǎng)頁(yè)正文中的圖片為相對(duì)路徑時(shí)，拼上網(wǎng)址。

通過(guò)勾選下面的With Body Html復(fù)選框，可以返回正文所在的區(qū)域的網(wǎng)頁(yè)源代碼。

看完上述內(nèi)容，你們掌握Gne如何提取新聞網(wǎng)頁(yè)的方法了嗎？如果還想學(xué)到更多技能或想了解更多相關(guān)內(nèi)容，歡迎關(guān)注億速云行業(yè)資訊頻道，感謝各位的閱讀！

向AI問(wèn)一下細(xì)節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng)，如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱：is@yisu.com進(jìn)行舉報(bào)，并提供相關(guān)證據(jù)，一經(jīng)查實(shí)，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
Apeaksoft Android Toolkit Mac安卓數(shù)據(jù)恢復(fù)軟件有什么功能
下一篇新聞：
JS的script標(biāo)簽屬性有哪些

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動(dòng)

幫助支持

關(guān)于我們

售后咨詢

7*24小時(shí)在線電話：400-100-2938

7*24小時(shí)在線 QQ：800811969

關(guān)注億速云

億速云公眾號(hào)

手機(jī)網(wǎng)站二維碼