溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

大數(shù)據(jù)到底能做什么?需要學習哪些知識?

發(fā)布時間:2020-06-02 23:42:23 來源:網(wǎng)絡 閱讀:230 作者:友信科創(chuàng) 欄目:大數(shù)據(jù)

相信很多大數(shù)據(jù)的初學者或者想轉行大數(shù)據(jù)開發(fā)的朋友最關注的問題就是大數(shù)據(jù)開發(fā)到底可以做什么。

什么是大數(shù)據(jù)?

?"大數(shù)據(jù)"這個詞頻繁的出現(xiàn)在媒體是2007年之后的事了。盡管已經(jīng)過去了10多年的時間,但是大家對它的理解并不統(tǒng)一,甚至有時候會對它有誤解,比如很多人將”大數(shù)據(jù)“跟“大規(guī)模數(shù)據(jù)”混為一談。

要想知道大數(shù)據(jù)能做什么,我們得首先搞清楚到底什么是大數(shù)據(jù),它有哪些特征。

?大數(shù)據(jù)最明顯的特征就是體量大,但是數(shù)據(jù)僅僅是體量大,并不能算是大數(shù)據(jù)。比如一個人的基因全圖譜的數(shù)據(jù)是上百GB到1TB之間,從數(shù)據(jù)量上來說已經(jīng)夠大了。但是它沒有太大的統(tǒng)計意義。所以體量大,僅僅是大數(shù)據(jù)一個特點,并不是數(shù)據(jù)量大都能稱得上大數(shù)據(jù)。

大數(shù)據(jù)除了數(shù)據(jù)量大之外,一些大數(shù)據(jù)專家將大數(shù)據(jù)的特征概括成了三個V,即Vast(大數(shù)據(jù)量)、Variety(多樣性)、Velocity(及時性)

僅僅數(shù)據(jù)量大是沒有任何意義的,我們需要對數(shù)據(jù)進行管理‘分析才能實現(xiàn)較高的商業(yè)價值。

?

大數(shù)據(jù)究竟可以用在哪些方面呢??

大數(shù)據(jù)的應用實在太過廣泛,可以說大數(shù)據(jù)已經(jīng)對各行各業(yè)都有著革命性的改革,物流、×××、營銷、客戶管理、醫(yī)療、零售、環(huán)保等等都有其身影。

零售行業(yè),可以根據(jù)需求和庫存的情況,適時調整價格 。

醫(yī)療行業(yè),可以根據(jù)眾多病人的特征,分析原因,量級太小的時候,這些特征根本不明顯,不會得到重視,只有在大量數(shù)據(jù)中,才能發(fā)現(xiàn)平時注意不到的現(xiàn)象。

公共安全方面,可以根據(jù)以往犯罪數(shù)據(jù)預測發(fā)生犯罪事件的地區(qū)與概率。

娛樂方面,比如《紙牌屋》的制作公司根據(jù)以往的用戶習慣,打造出大受歡迎的電視劇

?

學習大數(shù)據(jù)需要掌握哪些知識呢?

  1. Java SE也就是所謂的Java基礎、sql(建議從mysql入手)、?Linux

2.?大數(shù)據(jù)離線分析:如Hadoop Hive HBase、sqoop、flume等

  1. 大數(shù)據(jù)實時分析:scalc語言、Spark等

  2. 大數(shù)據(jù)機器學習(擴展)?
    spark MLlib:機器學習庫?
    pyspark編程:Python和spark的結合?
    推薦系統(tǒng)?
    python數(shù)據(jù)分析?
    Python機器學習

大家有什么想了解更多可以加wx:fiercelf


作者:友信科創(chuàng)-名師劉峰
來源:CSDN
原文:https://blog.csdn.net/weixin_36043432/article/details/91367065
版權聲明:本文為博主原創(chuàng)文章,轉載請附上博文鏈接!

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內容。

AI