溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

GitHub項目幫你從頭開始學(xué)數(shù)據(jù)科學(xué)

發(fā)布時間:2021-10-18 17:25:12 來源:億速云 閱讀:123 作者:iii 欄目:web開發(fā)

這篇文章主要介紹“GitHub項目幫你從頭開始學(xué)數(shù)據(jù)科學(xué)”,在日常操作中,相信很多人在GitHub項目幫你從頭開始學(xué)數(shù)據(jù)科學(xué)問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”GitHub項目幫你從頭開始學(xué)數(shù)據(jù)科學(xué)”的疑惑有所幫助!接下來,請跟著小編一起來學(xué)習(xí)吧!

從頭開始學(xué)習(xí)數(shù)據(jù)科學(xué)的免費資源。

如何入門數(shù)據(jù)科學(xué)?

這個 GitHub 項目提供了一份免費學(xué)習(xí)資源,既包括超詳細的學(xué)習(xí)路線圖,又涵蓋多個免費線上課程、大量數(shù)據(jù)科學(xué)項目和 100 多本免費機器學(xué)習(xí)書籍,項目上線數(shù)天即獲得 2.4k 星。

該項目收集了散布在網(wǎng)絡(luò)上的不同資源,并按照一定的順序進行組合,以幫助數(shù)據(jù)科學(xué)初學(xué)者解決如何搜索免費和結(jié)構(gòu)化學(xué)習(xí)資源的問題。項目作者表示,該項目將基于新的免費資源持續(xù)更新。

數(shù)據(jù)科學(xué)家學(xué)習(xí)路線圖

GitHub項目幫你從頭開始學(xué)數(shù)據(jù)科學(xué)

「磨刀不誤砍柴工?!乖擁椖渴紫仍敿毥榻B了一份數(shù)據(jù)科學(xué)路線圖,羅列了數(shù)據(jù)科學(xué)學(xué)習(xí)者需要掌握的內(nèi)容:

基礎(chǔ)知識(矩陣和代數(shù)基礎(chǔ)等);

統(tǒng)計學(xué)(概率論、貝葉斯定理等);

編程;

機器學(xué)習(xí);

文本挖掘 / 自然語言處理;

數(shù)據(jù)可視化;

大數(shù)據(jù);

數(shù)據(jù)獲?。?/p>

數(shù)據(jù)再加工(Data Munging);

工具箱。

成為數(shù)據(jù)科學(xué)家需要掌握的基礎(chǔ)知識

在成為數(shù)據(jù)科學(xué)家之前,你需要掌握關(guān)于矩陣的理論知識,了解其操作方式,熟悉矩陣的各種變換。項目作者還向我們介紹了多種數(shù)據(jù)結(jié)構(gòu),包括哈希函數(shù)、二叉樹等。

以二叉樹為例,項目作者解釋了什么是二叉樹:「在計算機科學(xué)中,二叉樹是一種樹數(shù)據(jù)結(jié)構(gòu),其中每個節(jié)點最多具有兩個子節(jié)點,稱為左子節(jié)點和右子節(jié)點?!?/p>

GitHub項目幫你從頭開始學(xué)數(shù)據(jù)科學(xué)

二叉樹

除了矩陣知識以外,數(shù)據(jù)科學(xué)初學(xué)者還需掌握關(guān)系代數(shù)、數(shù)據(jù)庫基礎(chǔ)知識、CAP 原理、ETL 等多達十多個知識點(有些部分還在更新中)。

統(tǒng)計學(xué)

該項目介紹了許多關(guān)于統(tǒng)計學(xué)的知識,包括數(shù)據(jù)集的選擇、描述性統(tǒng)計、探索性數(shù)據(jù)分析、直方圖、概率論、貝葉斯定理等內(nèi)容。

以探索性數(shù)據(jù)分析為例,項目作者從數(shù)據(jù)的可視化和分析兩方面著手,向我們介紹了完成整個數(shù)據(jù)分析任務(wù)需要的開發(fā)環(huán)境、依賴庫、安裝方式以及分析方式。

GitHub項目幫你從頭開始學(xué)數(shù)據(jù)科學(xué)

點擊 Seaborn 鏈接,可進入 Seaborn 主頁,該圖為鏈接到的主頁內(nèi)容。

在數(shù)據(jù)分析方面,項目作者介紹了 PCA 降維方法,幫助學(xué)習(xí)者了解什么是主成分分析,以及如何在 Python 中實現(xiàn)。

編程

成為數(shù)據(jù)科學(xué)家離不開編程,該項目介紹了需要掌握的編程語言 Python、R setup/R studio 等內(nèi)容。以 R setup / R studio 為例,項目作者介紹了兩種安裝方式 Linux、Windows。但是本部分內(nèi)容還有許多待補充知識。

GitHub項目幫你從頭開始學(xué)數(shù)據(jù)科學(xué)

待補充內(nèi)容

機器學(xué)習(xí)

該項目還列舉了掌握數(shù)據(jù)科學(xué)需要了解的機器學(xué)習(xí)知識,包括數(shù)值變量、分類變量、監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、訓(xùn)練集和測試集、分類器、過擬合、偏差和方差、支持向量機等 30 項內(nèi)容。

以支持向量機為例,項目作者首先介紹了支持向量機的作用——可用于分類和回歸任務(wù),接著用簡單明了的語言解釋了支持向量機的原理。此外,項目作者還列舉了關(guān)于支持向量機的其他知識,讀者可通過鏈接自行學(xué)習(xí)。

GitHub項目幫你從頭開始學(xué)數(shù)據(jù)科學(xué)

支持向量機

除了上述介紹的內(nèi)容外,項目作者還整理了文本挖掘、數(shù)據(jù)可視化等內(nèi)容,此處不再贅述。

免費線上課程

該項目基于 GitHub 用戶 Developer-Y 的項目整理了大量線上免費課程的資源,包括人工智能、機器學(xué)習(xí)、機器人學(xué)三個主要部分。其中機器學(xué)習(xí)部分又細分為機器學(xué)習(xí)導(dǎo)論、數(shù)據(jù)挖掘、數(shù)據(jù)科學(xué)、概率圖模型、深度學(xué)習(xí)、強化學(xué)習(xí)、進階版機器學(xué)習(xí)課程、基于機器學(xué)習(xí)的自然語言處理與計算機視覺、時序分析、概率與統(tǒng)計學(xué)、線性代數(shù)等。

GitHub項目幫你從頭開始學(xué)數(shù)據(jù)科學(xué)

該項目提供的免費線上課程列表部分截圖。

從該項目列表中,我們可以看到熟悉的吳恩達機器學(xué)習(xí)課程,以及來自卡內(nèi)基梅隆大學(xué)、斯坦福大學(xué)、蘇黎世聯(lián)邦理工學(xué)院、加州大學(xué)伯克利分校、微軟等機構(gòu)的豐富課程資源。

人工智能開源項目

此外,該項目還羅列了大量人工智能開源項目,涵蓋機器學(xué)習(xí)、深度學(xué)習(xí)、自然語言處理、計算機視覺這些領(lǐng)域。

這一資源來自 AI 研究者、數(shù)據(jù)科學(xué)家 Ashish Patel 創(chuàng)建的 GitHub 庫,目前包含 71 個條目,點開鏈接即可獲取相應(yīng)的項目和代碼資源。

GitHub項目幫你從頭開始學(xué)數(shù)據(jù)科學(xué)

項目列表部分截圖。

從目前的列表中,我們可以看到它包括目標檢測、聊天機器人、GUI、無監(jiān)督學(xué)習(xí)、回歸分析、情感分析、推薦系統(tǒng)、數(shù)據(jù)科學(xué)、NLP、計算機視覺等細分領(lǐng)域的相關(guān)項目資源。蓋列表將持續(xù)更新。

100+ 免費機器學(xué)習(xí)書籍

項目作者整理了一份來自 Insane 的機器學(xué)習(xí)書籍列表文章。該列表在 2021 年 1 月份剛剛更新過,包括我們熟悉的「花書」《深度學(xué)習(xí)》,以及主題為圖算法、自然語言處理、數(shù)據(jù)挖掘、GAN、Python 等的書籍。

GitHub項目幫你從頭開始學(xué)數(shù)據(jù)科學(xué)

到此,關(guān)于“GitHub項目幫你從頭開始學(xué)數(shù)據(jù)科學(xué)”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識,請繼續(xù)關(guān)注億速云網(wǎng)站,小編會繼續(xù)努力為大家?guī)砀鄬嵱玫奈恼拢?/p>

向AI問一下細節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI