概述 在上一期中,我們抓取了新聞數(shù)據(jù),現(xiàn)在我們要通過GoldData融合到兩張數(shù)據(jù)庫表news_site和news表當(dāng)中去。如下圖所示: 我們很容易看到這兩張表存在關(guān)聯(lián),那是怎樣將數(shù)據(jù)寫入關(guān)聯(lián)呢
概要 本文將介紹使用GoldData半自動登錄功能,來采集需要登錄網(wǎng)站的數(shù)據(jù)。GoldData半自動登錄功能,就是指通過腳本來執(zhí)行登錄,如果需要驗證碼或者其它內(nèi)容需要人工輸入時,可以通過收發(fā)郵件來執(zhí)行
概述 通常抓取級聯(lián)數(shù)數(shù)據(jù)情況不多,但要是真需要時,確多了一些麻煩,比如抓取商品分類級別信息等。本內(nèi)容將講述如何采集無限級聯(lián)聯(lián)數(shù)據(jù),并以GoldData來抓取2019年最新的省市縣三級為示例。 創(chuàng)建數(shù)據(jù)
概述 在本節(jié)中,我們將講述抓取政府官網(wǎng)地方新聞。并將抓取的新聞數(shù)據(jù)融入到以下兩張數(shù)據(jù)表news_site和news中。 news_site(新聞來源) 字段 類型 說明 id bigi