溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

大數(shù)據(jù)對科學(xué)研究的影響有哪些

發(fā)布時間:2022-01-14 17:43:40 來源:億速云 閱讀:2046 作者:iii 欄目:大數(shù)據(jù)

本篇內(nèi)容介紹了“大數(shù)據(jù)對科學(xué)研究的影響有哪些”的有關(guān)知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!

  著名數(shù)據(jù)庫專家吉姆·格雷(Jim Gray)博士觀察并總結(jié)認(rèn)為,人類自古以來在科學(xué)研究上先后歷經(jīng)了實驗、理論、計算和數(shù)據(jù)四種范式,具體如下:

 ?。?)第一種范式:實驗

  在最初的科學(xué)研究階段,人類采用實驗來解決一些科學(xué)問題,著名的比薩斜塔實驗就是一個典型實例。1590年,伽利略在比薩斜塔上做了“兩個鐵球同時落地”的實驗,得出了重量不同的兩個鐵球同時下落的結(jié)論,從此推翻了亞里士多德“物體下落速度和重量成比例”的學(xué)說,糾正了這個持續(xù)了1 900年之久的錯誤結(jié)論。

 ?。?)第二種范式:理論

  隨著科學(xué)的進(jìn)步,人類開始采用各種數(shù)學(xué)、幾何、物理等理論,構(gòu)建問題模型和解決方案。比如牛頓第一定律、牛頓第二定律、牛頓第三定律構(gòu)成了牛頓力學(xué)的完整體系,奠定了經(jīng)典力學(xué)的概念基礎(chǔ),它的廣泛傳播和運用對人們的生活和思想產(chǎn)生了重大影響,在很大程度上推動了人類社會的發(fā)展與進(jìn)步。

 ?。?)第三種范式:計算

  隨著1946年人類歷史上第一臺計算機ENIAC的誕生,人類社會開始步入計算機時代,科學(xué)研究也進(jìn)入了一個以“計算”為中心的全新時期。通過設(shè)計算法并編寫相應(yīng)程序輸入計算機運行,人類可以借助于計算機的高速運算能力去解決各種問題。計算機具有存儲容量大、運算速度快、精度高、可重復(fù)執(zhí)行等特點,是科學(xué)研究的利器,推動了人類社會的飛速發(fā)展

 ?。?)第四種范式:數(shù)據(jù)

  隨著數(shù)據(jù)的不斷累積,其寶貴價值日益得到體現(xiàn),物聯(lián)網(wǎng)和云計算的出現(xiàn),更是促成了事物發(fā)展從量變到質(zhì)變的轉(zhuǎn)變,使人類社會開啟了全新的大數(shù)據(jù)時代。在大數(shù)據(jù)環(huán)境下,一切將以數(shù)據(jù)為中心,從數(shù)據(jù)中發(fā)現(xiàn)問題、解決問題,真正體現(xiàn)數(shù)據(jù)的價值。大數(shù)據(jù)將成為科學(xué)工作者的寶藏,從數(shù)據(jù)中可以挖掘未知模式和有價值的信息,服務(wù)于生產(chǎn)和生活,推動科技創(chuàng)新和社會進(jìn)步。

  2 大數(shù)據(jù)對思維方式的影響

  維克托·邁爾·舍恩伯格在《大數(shù)據(jù)時代:生活、工作與思維的大變革》一書中明確指出,大數(shù)據(jù)時代最大的轉(zhuǎn)變就是思維方式的3種轉(zhuǎn)變:全樣而非抽樣、效率而非精確、相關(guān)而非因果。

 ?。?)全樣而非抽樣

  過去,由于數(shù)據(jù)存儲和處理能力的限制,在科學(xué)分析中,通常采用抽樣的方法,即從全集數(shù)據(jù)中抽取一部分樣本數(shù)據(jù),通過對樣本數(shù)據(jù)的分析,來推斷全集數(shù)據(jù)的總體特征。通常,樣本數(shù)據(jù)規(guī)模要比全集數(shù)據(jù)小很多,因此,可以在可控的代價內(nèi)實現(xiàn)數(shù)據(jù)分析的目的?,F(xiàn)在,我們已經(jīng)迎來大數(shù)據(jù)時代,大數(shù)據(jù)技術(shù)的核心就是海量數(shù)據(jù)的存儲和處理,分布式文件系統(tǒng)和分布式數(shù)據(jù)庫技術(shù),提供了理論上近乎無限的數(shù)據(jù)存儲能力,分布式并行編程框架MapReduce提供了強大的海量數(shù)據(jù)并行處理能力。因此,有了大數(shù)據(jù)技術(shù)的支持,科學(xué)分析完全可以直接針對全集數(shù)據(jù)而不是抽樣數(shù)據(jù),并且可以在短時間內(nèi)迅速得到分析結(jié)果,速度之快,超乎我們的想象。就像前面我們已經(jīng)提到過的,谷歌公司的Dremel可以在2~3秒內(nèi)完成PB級別數(shù)據(jù)的查詢。

 ?。?)效率而非精確

  過去,我們在科學(xué)分析中采用抽樣分析方法,就必須追求分析方法的精確性,因為,抽樣分析只是針對部分樣本的分析,其分析結(jié)果被應(yīng)用到全集數(shù)據(jù)以后,誤差會被放大,這就意味著,抽樣分析的微小誤差,被放大到全集數(shù)據(jù)以后,可能會變成一個很大的誤差。因此,為了保證誤差被放大到全集數(shù)據(jù)時仍然處于可以接受的范圍,就必要確保抽樣分析結(jié)果的精確性。正是由于這個原因,傳統(tǒng)的數(shù)據(jù)分析方法往往更加注重提高算法的精確性,其次才是提高算法效率。現(xiàn)在,大數(shù)據(jù)時代采用全樣分析而不是抽樣分析,全樣分析結(jié)果就不存在誤差被放大的問題,因此,追求高精確性已經(jīng)不是其首要目標(biāo);相反,大數(shù)據(jù)時代具有“秒級響應(yīng)”的特征,要求在幾秒內(nèi)就迅速給出針對海量數(shù)據(jù)的實時分析結(jié)果,否則就會喪失數(shù)據(jù)的價值,因此,數(shù)據(jù)分析的效率成為關(guān)注的核心。

 ?。?)相關(guān)而非因果

  過去,數(shù)據(jù)分析的目的,一方面是解釋事物背后的發(fā)展機理,比如,一個大型超市在某個地區(qū)的連鎖店在某個時期內(nèi)凈利潤下降很多,這就需要IT部門對相關(guān)銷售數(shù)據(jù)進(jìn)行詳細(xì)分析找出發(fā)生問題的原因;另一方面是用于預(yù)測未來可能發(fā)生的事件,比如,通過實時分析微博數(shù)據(jù),當(dāng)發(fā)現(xiàn)人們對霧霾的討論明顯增加時,就可以建議銷售部門增加口罩的進(jìn)貨量,因為,人們關(guān)注霧霾的一個直接結(jié)果是,大家會想到購買一個口罩來保護自己的身體健康。不管是哪個目的,其實都反映了一種“因果關(guān)系”。但是,在大數(shù)據(jù)時代,因果關(guān)系不再那么重要,人們轉(zhuǎn)而追求“相關(guān)性”而非“因果性”。比如,我們?nèi)ヌ詫毦W(wǎng)購物時,當(dāng)我們購買了一個汽車防盜鎖以后,淘寶網(wǎng)還會自動提示你,與你購買相同物品的其他客戶還購買了汽車坐墊,也就是說,淘寶網(wǎng)只會告訴你“購買汽車防盜鎖”和“購買汽車坐墊”之間存在相關(guān)性,但是,并不會告訴你為什么其他客戶購買了汽車防盜鎖以后還會購買汽車坐墊。

“大數(shù)據(jù)對科學(xué)研究的影響有哪些”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識可以關(guān)注億速云網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實用文章!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI