溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

大數(shù)據(jù)的核心價值是什么

發(fā)布時間:2021-03-29 09:19:40 來源:億速云 閱讀:3831 作者:小新 欄目:互聯(lián)網科技

這篇文章將為大家詳細講解有關大數(shù)據(jù)的核心價值是什么,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。

大數(shù)據(jù)的核心就是預測。大數(shù)據(jù)的本質是解決問題,大數(shù)據(jù)的核心價值就在于預測;大數(shù)據(jù)是把數(shù)學算法運用到海量的數(shù)據(jù)上來預測事情發(fā)生的可能性,是基于大數(shù)據(jù)和預測模型去預測未來某件事情的概率。

大數(shù)據(jù)的核心就是預測。它通常被視為人工智能的一部分,或者更確切地說,被視為一種機器學習。但是這種定義是有誤導性的。大數(shù)據(jù)不是要教機器像人一樣思考。

相反,它是把數(shù)學算法運用到海量的數(shù)據(jù)上來預測事情發(fā)生的可能性。一封郵件被作為垃圾郵件過濾掉的可能性,輸入的“teh”應該是“the”的可能性,從一個人亂穿馬路時行進的軌跡和速度來看他能及時穿過馬路的可能性,都是大數(shù)據(jù)可以預測的范圍。當然,如果一個人能及時穿過馬路,那么他亂穿馬路時,車子就只需要稍稍減速就好。這些預測系統(tǒng)之所以能夠成功,關鍵在于它們是建立在海量數(shù)據(jù)的基礎之上的。此外,隨著系統(tǒng)接收到的數(shù)據(jù)越來越多,它們可以聰明到自動搜索最好的信號和模式,并自己改善自己。

大數(shù)據(jù)預測(大數(shù)據(jù)核心應用)

大數(shù)據(jù)預測是大數(shù)據(jù)最核心的應用,它將傳統(tǒng)意義的預測拓展到“現(xiàn)測”。大數(shù)據(jù)預測的優(yōu)勢體現(xiàn)在,它把一個非常困難的預測問題,轉化為一個相對簡單的描述問題,而這是傳統(tǒng)小數(shù)據(jù)集根本無法企及的。從預測的角度看,大數(shù)據(jù)預測所得出的結果不僅僅是用于處理現(xiàn)實業(yè)務的簡單、客觀的結論,更是能用于幫助企業(yè)經營的決策。

1. 預測是大數(shù)據(jù)的核心價值

大數(shù)據(jù)的本質是解決問題,大數(shù)據(jù)的核心價值就在于預測,而企業(yè)經營的核心也是基于預測而做出正確判斷。在談論大數(shù)據(jù)應用時,最常見的應用案例便是“預測股市”“預測流感”“預測消費者行為”等。

大數(shù)據(jù)預測則是基于大數(shù)據(jù)和預測模型去預測未來某件事情的概率。讓分析從“面向已經發(fā)生的過去”轉向“面向即將發(fā)生的未來”是大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)分析的最大不同。

大數(shù)據(jù)預測的邏輯基礎是,每一種非常規(guī)的變化事前一定有征兆,每一件事情都有跡可循,如果找到了征兆與變化之間的規(guī)律,就可以進行預測。大數(shù)據(jù)預測無法確定某件事情必然會發(fā)生,它更多是給出一個事件會發(fā)生的概率。

實驗的不斷反復、大數(shù)據(jù)的日漸積累讓人類不斷發(fā)現(xiàn)各種規(guī)律,從而能夠預測未來。利用大數(shù)據(jù)預測可能的災難,利用大數(shù)據(jù)分析癌癥可能的引發(fā)原因并找出治療方法,都是未來能夠惠及人類的事業(yè)。

例如,大數(shù)據(jù)曾被洛杉磯警察局和加利福尼亞大學合作用于預測犯罪的發(fā)生;Google 流感趨勢利用搜索關鍵詞預測禽流感的散布;麻省理工學院利用手機定位數(shù)據(jù)和交通數(shù)據(jù)進行城市規(guī)劃;氣象局通過整理近期的氣象情況和衛(wèi)星云圖,更加精確地判斷未來的天氣狀況。

2. 大數(shù)據(jù)預測的思維改變

在過去,人們的決策主要是依賴 20% 的結構化數(shù)據(jù),而大數(shù)據(jù)預測則可以利用另外 80% 的非結構化數(shù)據(jù)來做決策。大數(shù)據(jù)預測具有更多的數(shù)據(jù)維度,更快的數(shù)據(jù)頻度和更廣的數(shù)據(jù)寬度。與小數(shù)據(jù)時代相比,大數(shù)據(jù)預測的思維具有 3 大改變:實樣而非抽樣;預測效率而非精確;相關關系而非因果關系。

1)實樣而非抽樣

在小數(shù)據(jù)時代,由于缺乏獲取全體樣本的手段,人們發(fā)明了“隨機調研數(shù)據(jù)”的方法。理論上,抽取樣本越隨機,就越能代表整體樣本。但問題是獲取一個隨機樣本的代價極高,而且很費時。人口調查就是一個典型例子,一個國家很難做到每年都完成一次人口調查,因為隨機調研實在是太耗時耗力,然而云計算和大數(shù)據(jù)技術的出現(xiàn),使得獲取足夠大的樣本數(shù)據(jù)乃至全體數(shù)據(jù)成為可能。

2)效率而非精確

小數(shù)據(jù)時代由于使用抽樣的方法,所以需要在數(shù)據(jù)樣本的具體運算上非常精確,否則就會“差之毫厘,失之千里”。例如,在一個總樣本為 1 億的人口中隨機抽取 1000 人進行人口調查,如果在 1000 人上的運算出現(xiàn)錯誤,那么放大到 1 億中時,偏差將會很大。但在全樣本的情況下,有多少偏差就是多少偏差,而不會被放大。

在大數(shù)據(jù)時代,快速獲得一個大概的輪廓和發(fā)展脈絡,比嚴格的精確性要重要得多。有時候,當掌握了大量新型數(shù)據(jù)時,精確性就不那么重要了,因為我們仍然可以掌握事情的發(fā)展趨勢。大數(shù)據(jù)基礎上的簡單算法比小數(shù)據(jù)基礎上的復雜算法更加有效。數(shù)據(jù)分析的目的并非就是數(shù)據(jù)分析,而是用于決策,故而時效性也非常重要。

3)相關性而非因果關系

大數(shù)據(jù)研究不同于傳統(tǒng)的邏輯推理研究,它需要對數(shù)量巨大的數(shù)據(jù)做統(tǒng)計性的搜索、比較、聚類、分類等分析歸納,并關注數(shù)據(jù)的相關性或稱關聯(lián)性。相關性是指兩個或兩個以上變量的取值之間存在某種規(guī)律性。相關性沒有絕對,只有可能性。但是,如果相關性強,則一個相關性成功的概率是很高的。

相關性可以幫助我們捕捉現(xiàn)在和預測未來。如果 A 和 B 經常一起發(fā)生,則我們只需要注意到 B 發(fā)生了,就可以預測 A 也發(fā)生了。

根據(jù)相關性,我們理解世界不再需要建立在假設的基礎上,這個假設是指針對現(xiàn)象建立的有關其產生機制和內在機理的假設。因此,我們也不需要建立這樣的假設,即哪些檢索詞條可以表示流感在何時何地傳播;航空公司怎樣給機票定價;沃爾瑪?shù)念櫩偷呐腼兿埠檬鞘裁础H《氖?,我們可以對大?shù)據(jù)進行相關性分析,從而知道哪些檢索詞條是最能顯示流感的傳播的,飛機票的價格是否會飛漲,哪些食物是颶風期間待在家里的人最想吃的。

數(shù)據(jù)驅動的關于大數(shù)據(jù)的相關性分析法,取代了基于假想的易出錯的方法。大數(shù)據(jù)的相關性分析法更準確、更快,而且不易受偏見的影響。建立在相關性分析法基礎上的預測是大數(shù)據(jù)的核心。

相關性分析本身的意義重大,同時它也為研究因果關系奠定了基礎。通過找出可能相關的事物,我們可以在此基礎上進行進一步的因果關系分析。如果存在因果關系,則再進一步找出原因。這種便捷的機制通過嚴格的實驗降低了因果分析的成本。我們也可以從相互聯(lián)系中找到一些重要的變量,這些變量可以用到驗證因果關系的實驗中去。

3. 大數(shù)據(jù)預測的典型應用領域

互聯(lián)網給大數(shù)據(jù)預測應用的普及帶來了便利條件,結合國內外案例來看,以下 11 個領域是最有機會的大數(shù)據(jù)預測應用領域。

1)天氣預報

天氣預報是典型的大數(shù)據(jù)預測應用領域。天氣預報粒度已經從天縮短到小時,有嚴苛的時效要求。如果基于海量數(shù)據(jù)通過傳統(tǒng)方式進行計算,則得出結論時明天早已到來,預測并無價值,而大數(shù)據(jù)技術的發(fā)展則提供了高速計算能力,大大提高了天氣預報的實效性和準確性。

2)體育賽事預測

2014 年世界杯期間,Google、百度、微軟和高盛等公司都推出了比賽結果預測平臺。百度的預測結果最為亮眼,全程 64 場比賽的預測準確率為 67%,進入淘汰賽后準確率為 94%。這意味著未來的體育賽事會被大數(shù)據(jù)預測所掌控。

Google 世界杯預測是基于 Opta Sports 的海量賽事數(shù)據(jù)來構建最終的預測模型的。百度則是通過搜索過去 5 年內全世界 987 支球隊(含國家隊和俱樂部隊)的 3.7 萬場比賽數(shù)據(jù),

同時與中國彩票網站樂彩網、歐洲必發(fā)指數(shù)數(shù)據(jù)供應商 SPdex 進行數(shù)據(jù)合作,導入博彩市場的預測數(shù)據(jù),建立了一個囊括 199 972 名球員和 1.12 億條數(shù)據(jù)的預測模型,并在此基礎上進行結果預測。

從互聯(lián)網公司的成功經驗來看,只要有體育賽事歷史數(shù)據(jù),并且與指數(shù)公司進行合作,便可以進行其他賽事的預測,如歐冠、NBA 等賽事。

3)股票市場預測

去年,英國華威商學院和美國波士頓大學物理系的研究發(fā)現(xiàn),用戶通過 Google 搜索的金融關鍵詞或許可以預測金融市場的走向,相應的投資戰(zhàn)略收益高達 326%。此前則有專家嘗試通過 Twitter 博文情緒來預測股市波動。

4)市場物價預測

CPI 用于表征已經發(fā)生的物價浮動情況,但統(tǒng)計局的數(shù)據(jù)并不權威。大數(shù)據(jù)則可能幫助人們了解未來物價的走向,提前預知通貨膨脹或經濟危機。最典型的案例莫過于馬云通過阿里 B2B 大數(shù)據(jù)提前知曉亞洲金融危機。

單個商品的價格預測更加容易,尤其是機票這樣的標準化產品,“去哪兒”提供的“機票日歷”就是價格預測,它能告知你幾個月后機票的大概價位。

由于商品的生產、渠道成本和大概毛利在充分競爭的市場中是相對穩(wěn)定的,與價格相關的變量是相對固定的,商品的供需關系在電子商務平臺上可實時監(jiān)控,因此價格可以預測。基于預測結果可提供購買時間建議,或者指導商家進行動態(tài)價格調整和營銷活動以實現(xiàn)利益最大化。

5)用戶行為預測

基于用戶搜索行為、瀏覽行為、評論歷史和個人資料等數(shù)據(jù),互聯(lián)網業(yè)務可以洞察消費者的整體需求,進而進行針對性的產品生產、改進和營銷?!都埮莆荨愤x擇演員和劇情,百度基于用戶喜好進行精準廣告營銷,阿里根據(jù)天貓用戶特征包下生產線定制產品,Amazon 預測用戶點擊行為提前發(fā)貨均是受益于互聯(lián)網用戶行為預測。如圖 1 所示。

大數(shù)據(jù)的核心價值是什么
圖 1  用戶行為預測

受益于傳感器技術和物聯(lián)網的發(fā)展,線下的用戶行為洞察正在醞釀。免費商用 Wi-Fi,iBeacon 技術、攝像頭影像監(jiān)控、室內定位技術、NFC 傳感器網絡、排隊叫號系統(tǒng),可以探知用戶線下的移動、停留、出行規(guī)律等數(shù)據(jù),從而進行精準營銷或者產品定制。

6)人體健康預測

中醫(yī)可以通過望聞問切的手段發(fā)現(xiàn)一些人體內隱藏的慢性病,甚至通過看體質便可知曉一個人將來可能會出現(xiàn)什么癥狀。人體體征變化有一定規(guī)律,而慢性病發(fā)生前人體已經會有一些持續(xù)性異常。理論上來說,如果大數(shù)據(jù)掌握了這樣的異常情況,便可以進行慢性病預測。

Nature 新聞與觀點報道過 Zeevi 等人的一項研究,即一個人的血糖濃度如何受特定的食物影響的復雜問題。該研究根據(jù)腸道中的微生物和其他方面的生理狀況,提岀了一種可以提供個性化的食物建議的預測模型,比目前的標準能更準確地預測血糖反應。如圖 2 所示。

大數(shù)據(jù)的核心價值是什么
圖 2  血糖濃度預測模型

智能硬件使慢性病的大數(shù)據(jù)預測變?yōu)榭赡堋?纱┐髟O備和智能健康設備可幫助網絡收集人體健康數(shù)據(jù),如心率、體重、血脂、血糖、運動量、睡眠量等狀況。如果這些數(shù)據(jù)足夠精準、全面,并且有可以形成算法的慢性病預測模式,或許未來這些穿戴設備就會提醒用戶身體罹患某種慢性病的風險。

7)疾病疫情預測

疾病疫情預測是指基于人們的搜索情況、購物行為預測大面積疫情暴發(fā)的可能性,最經典的“流感預測”便屬于此類。如果來自某個區(qū)域的“流感”“板藍根”搜索需求越來越多,自然可以推測該處有流感趨勢。

百度已經推出了疾病預測產品,目前可以就流感、肝炎、肺結核、性病這四種疾病,對全國每一個省份以及大多數(shù)地級市和區(qū)縣的活躍度、趨勢圖等情況,進行全面的監(jiān)控。未來,百度疾病預測監(jiān)控的疾病種類將從目前的 4 種擴展到 30 多種,覆蓋更多的常見病和流行病。用戶可以根據(jù)當?shù)氐念A測結果進行針對性的預防。

8)災害災難預測

氣象預測是最典型的災難災害預測。地震、洪澇、高溫、暴雨這些自然災害如果可以利用大數(shù)據(jù)的能力進行更加提前的預測和告知,便有助于減災、防災、救災、賑災。與過往不同的是,過去的數(shù)據(jù)收集方式存在著有死角、成本高等問題,而在物聯(lián)網時代,人們可以借助廉價的傳感器攝像頭和無線通信網絡,進行實時的數(shù)據(jù)監(jiān)控收集,再利用大數(shù)據(jù)預測分析,做到更精準的自然災害預測。

9)環(huán)境變遷預測

除了進行短時間微觀的天氣、災害預測之外,還可以進行更加長期和宏觀的環(huán)境和生態(tài)變遷預測。森林和農田面積縮小,野生動物植物瀕危,海岸線上升,溫室效應這些問題是地球面臨的“慢性問題”。人類知道越多地球生態(tài)系統(tǒng)以及天氣形態(tài)變化的數(shù)據(jù),就越容易模型化未來環(huán)境的變遷,進而阻止不好的轉變發(fā)生。大數(shù)據(jù)可幫助人類收集、儲存和挖掘更多的地球數(shù)據(jù),同時還提供了預測的工具。

10)交通行為預測

交通行為預測是指基于用戶和車輛的 LBS 定位數(shù)據(jù),分析人車出行的個體和群體特征,進行交通行為的預測。交通部門可通過預測不同時點、不同道路的車流量,來進行智能的車輛調度,或應用潮汐車道;用戶則可以根據(jù)預測結果選擇擁堵概率更低的道路。

百度基于地圖應用的 LBS 預測涵蓋范圍更廣。它在春運期間可預測人們的遷徙趨勢來指導火車線路和航線的設置,在節(jié)假日可預測景點的人流量來指導人們的景區(qū)選擇,平時還有百度熱力圖來告訴用戶城市商圈、動物園等地點的人流情況,從而指導用戶出行選擇和商家的選點選址。

11)能源消耗預測

力口州電網系統(tǒng)運營中心管理著加州超過 80% 的電網,向 3500 萬用戶每年輸送 2.89 億兆瓦電力,電力線長度超過 40 000 千米。該中心采用了 Space-Time Insight 的軟件進行智能管理,綜合分析來自天氣、傳感器、計量設備等各種數(shù)據(jù)源的海量數(shù)據(jù),預測各地的能源需求變化,進行智能電能調度,平衡全網的電力供應和需求,并對潛在危機做出快速響應。中國智能電網業(yè)已在嘗試類似的大數(shù)據(jù)預測應用。

除了上面列舉的 11 個領域之外,大數(shù)據(jù)預測還可被應用在房地產預測、就業(yè)情況預測、高考分數(shù)線預測、選舉結果預測、奧斯卡大獎預測、保險投保者風險評估、金融借貸者還款能力評估等領域,讓人類具備可量化、有說服力、可驗證的洞察未來的能力,大數(shù)據(jù)預測的魅力正在釋放出來。

關于“大數(shù)據(jù)的核心價值是什么”這篇文章就分享到這里了,希望以上內容可以對大家有一定的幫助,使各位可以學到更多知識,如果覺得文章不錯,請把它分享出去讓更多的人看到。

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經查實,將立刻刪除涉嫌侵權內容。

AI