溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

數(shù)據(jù)科學(xué)、大數(shù)據(jù)特征的發(fā)展歷程

發(fā)布時間:2020-03-27 10:50:40 來源:億速云 閱讀:897 作者:小新 欄目:編程語言

今天小編分享的是數(shù)據(jù)科學(xué)、大數(shù)據(jù)特征的發(fā)展歷程,可能大家對數(shù)據(jù)科學(xué)、大數(shù)據(jù)并不陌生,或者從來沒有了解過數(shù)據(jù)科學(xué)、大數(shù)據(jù)。但是不用擔(dān)心,今天小編會以最簡單的描述來講解聚類算法的原理。一起來看看吧。

數(shù)據(jù)科學(xué)、大數(shù)據(jù)特征的發(fā)展歷程

1、數(shù)據(jù)挖掘的廣泛應(yīng)用

提到數(shù)據(jù)科學(xué)的發(fā)展歷程,我們就不得不來談?wù)剶?shù)據(jù)科學(xué)的基礎(chǔ)技術(shù)——數(shù)據(jù)挖掘。電子數(shù)據(jù)處理的初期,人們就試圖通過某些方法來實現(xiàn)自動決策支持。由于數(shù)據(jù)挖掘技術(shù)從一開始就是面向應(yīng)用的,它不僅是面向特定數(shù)據(jù)庫的簡單檢索查詢調(diào)用,而且要對這些數(shù)據(jù)進(jìn)行微觀、中觀乃至宏觀的統(tǒng)計、分析、綜合和推理,以指導(dǎo)實際問題的求解,企圖發(fā)現(xiàn)事件間的相互關(guān)聯(lián),甚至利用已有的數(shù)據(jù)對未來的活動進(jìn)行預(yù)測。因此,數(shù)據(jù)挖掘前景非常廣闊,目前已被證明有著廣泛驚人的應(yīng)用。

2Hadoop項目的實現(xiàn)

隨著抓取網(wǎng)頁數(shù)量的增加,數(shù)據(jù)科學(xué)領(lǐng)域遇到了嚴(yán)重的可擴(kuò)展性問題——如何解決數(shù)十億網(wǎng)頁的存儲和索引問題。Hadoop得以在大數(shù)據(jù)處理應(yīng)用中廣泛應(yīng)用得益于其自身在數(shù)據(jù)提取、變形和加載方面上的天然優(yōu)勢。Hadoop的分布式架構(gòu),將大數(shù)據(jù)處理引擎盡可能的靠近存儲。例如HadoopMapReduce功能實現(xiàn)了將單個任務(wù)打碎,并將碎片任務(wù)發(fā)送到多個節(jié)點上,之后再以單個數(shù)據(jù)集的形式加載到數(shù)據(jù)倉庫里。

3、深度學(xué)習(xí)的初步發(fā)展

數(shù)據(jù)科學(xué)的發(fā)展歷程最早可以追溯到21世紀(jì)00年代中期。這個時期就已經(jīng)就奠定了統(tǒng)計學(xué)習(xí)的理論基礎(chǔ)和框架。而深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)的分支,自2006年以來受到持續(xù)性關(guān)注。雖然深度學(xué)習(xí)的理論研究還基本處于起步階段,但在應(yīng)用領(lǐng)域已顯現(xiàn)出巨大能量。目前深度學(xué)習(xí)在計算機(jī)視覺、語音識別、自然語言處理等領(lǐng)域取得了巨大的成功,也造就了一批新興的公司。

4、神經(jīng)網(wǎng)絡(luò)技術(shù)落地

2010年,Google X部門就構(gòu)造了一個模擬人類的大腦神經(jīng)網(wǎng)絡(luò),無需接受人類的任何培訓(xùn)和指令,就可以利用內(nèi)在算法從海量數(shù)據(jù)中自動提取信息,學(xué)會如何識別貓咪。目前,Google正在將該虛擬人腦用于提升語音識別的準(zhǔn)確率。這項應(yīng)用也是不容小覷的,在未來我們可以預(yù)測,這項機(jī)器學(xué)習(xí)技術(shù)還可以用于實用型計算機(jī)視覺、攔截垃圾郵件,甚至自動駕駛汽車等領(lǐng)域。

5、數(shù)據(jù)可視化推向深入

我們現(xiàn)在已經(jīng)進(jìn)入了一個數(shù)據(jù)驅(qū)動的數(shù)據(jù)科學(xué)發(fā)展階段,掌握數(shù)據(jù)就能掌握發(fā)展方向,因此人們對于數(shù)據(jù)可視化技術(shù)的依賴程度也不斷加深。大數(shù)據(jù)時代的到來對數(shù)據(jù)可視化的發(fā)展有著沖擊性的影響,試圖繼續(xù)以傳統(tǒng)展現(xiàn)形式來表達(dá)龐大的數(shù)據(jù)量中的信息是不可能的,大規(guī)模的動態(tài)化數(shù)據(jù)要依靠更有效的處理算法和表達(dá)形式才能夠傳達(dá)出有價值的信息,因此大數(shù)據(jù)可視化的研究成為新的時代命題。

數(shù)據(jù)科學(xué)、大數(shù)據(jù)特征的發(fā)展歷程

6、強(qiáng)化學(xué)習(xí)引起重視

強(qiáng)化學(xué)習(xí)是一種人工智能方法,能使計算機(jī)在沒有明確指導(dǎo)的情況下像人一樣自主學(xué)習(xí)。如今,強(qiáng)化學(xué)習(xí)正在迅速發(fā)展,并逐步將人工智能滲透到除了游戲之外的各個領(lǐng)域。除了能夠提升自動駕駛汽車性能,該技術(shù)還能讓機(jī)器人領(lǐng)會并掌握以前從未訓(xùn)練過的技能。近幾年來,深度學(xué)習(xí)技術(shù)被證明是一種用來識別數(shù)據(jù)模式的極其高效的方式。在國內(nèi),以科大訊飛為例,這家公司已經(jīng)針對強(qiáng)化學(xué)習(xí)在多個方向展開了研究和應(yīng)用,包括人機(jī)對話系統(tǒng)、智能客服系統(tǒng)、機(jī)器輔助駕駛、機(jī)器人控制等方向,都已有了應(yīng)用研究。

7、云計算的基礎(chǔ)奠定

多年以來,數(shù)據(jù)科學(xué)已經(jīng)從一個小眾市場發(fā)展成為完整的領(lǐng)域,可用于分析的數(shù)據(jù)也呈爆炸式增長,組織和企業(yè)正在收集和存儲比以往更多的數(shù)據(jù)。所以,云計算進(jìn)入了數(shù)據(jù)科學(xué)領(lǐng)域。云計算使任何地方的任何人都可以訪問幾乎無限的處理能力。除了計算之外,云計算公司還為數(shù)據(jù)分析提供了完善的平臺。我們有理由相信,隨著數(shù)據(jù)科學(xué)的成熟和數(shù)據(jù)量更加巨大,我們最終可能會完全在云上完成數(shù)據(jù)科學(xué)。

8、自然語言處理獲得突破

自然語言處理在深度學(xué)習(xí)研究領(lǐng)域取得重大突破之后,自然語言處理已牢固地進(jìn)入數(shù)據(jù)科學(xué)領(lǐng)域。目前,NLP已成為數(shù)據(jù)科學(xué)中的強(qiáng)大工具。巨大的文本數(shù)據(jù)存儲,不僅可以是一個單詞的答案,還可以包含完整的段落,可以轉(zhuǎn)換為數(shù)值數(shù)據(jù)以進(jìn)行標(biāo)準(zhǔn)分析。現(xiàn)在我們可以探索更為復(fù)雜的數(shù)據(jù)集。

回顧數(shù)據(jù)科學(xué)的整個發(fā)展歷程,我們可以看到數(shù)據(jù)科學(xué)是一個技術(shù)迭代迅速、核心技術(shù)不斷突破的領(lǐng)域。未來數(shù)據(jù)科學(xué)會向什么方向急速發(fā)展,我們可能還難以準(zhǔn)確的預(yù)測,但是有一點是可以肯定的,數(shù)據(jù)科學(xué)領(lǐng)的相關(guān)技術(shù)和應(yīng)用將深刻且廣泛的影響大眾生活的方方面面。讓我們拭目以待,數(shù)據(jù)科學(xué)的技術(shù)如何創(chuàng)造一個又一個的奇跡吧!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI