#

golddata

  • GoldData將采集數(shù)據(jù)融合到兩張關(guān)聯(lián)關(guān)系表

    概述 在上一期中,我們抓取了新聞數(shù)據(jù),現(xiàn)在我們要通過GoldData融合到兩張數(shù)據(jù)庫表news_site和news表當(dāng)中去。如下圖所示: 我們很容易看到這兩張表存在關(guān)聯(lián),那是怎樣將數(shù)據(jù)寫入關(guān)聯(lián)呢

    作者:dataman100
    2020-08-09 15:02:01
  • Golddata如何采集需要登錄/會話的數(shù)據(jù)?

    概要 本文將介紹使用GoldData半自動登錄功能,來采集需要登錄網(wǎng)站的數(shù)據(jù)。GoldData半自動登錄功能,就是指通過腳本來執(zhí)行登錄,如果需要驗證碼或者其它內(nèi)容需要人工輸入時,可以通過收發(fā)郵件來執(zhí)行

    作者:dataman100
    2020-07-20 23:25:25
  • 如何采集級聯(lián)數(shù)據(jù)(比如最新省市縣)呢?

    概述 通常抓取級聯(lián)數(shù)數(shù)據(jù)情況不多,但要是真需要時,確多了一些麻煩,比如抓取商品分類級別信息等。本內(nèi)容將講述如何采集無限級聯(lián)聯(lián)數(shù)據(jù),并以GoldData來抓取2019年最新的省市縣三級為示例。 創(chuàng)建數(shù)據(jù)

    作者:dataman100
    2020-07-05 14:26:29
  • GoldData學(xué)習(xí)實例-采集官網(wǎng)新聞數(shù)據(jù)

    概述 在本節(jié)中,我們將講述抓取政府官網(wǎng)地方新聞。并將抓取的新聞數(shù)據(jù)融入到以下兩張數(shù)據(jù)表news_site和news中。 news_site(新聞來源) 字段 類型 說明 id bigi

    作者:dataman100
    2020-04-04 09:24:43