您好,登錄后才能下訂單哦!
這篇文章主要介紹“機(jī)器學(xué)習(xí)基本術(shù)語有哪些”,在日常操作中,相信很多人在機(jī)器學(xué)習(xí)基本術(shù)語有哪些問題上存在疑惑,小編查閱了各式資料,整理出簡(jiǎn)單好用的操作方法,希望對(duì)大家解答”機(jī)器學(xué)習(xí)基本術(shù)語有哪些”的疑惑有所幫助!接下來,請(qǐng)跟著小編一起來學(xué)習(xí)吧!
一、數(shù)據(jù)集
要進(jìn)行機(jī)器學(xué)習(xí),首先得有數(shù)據(jù)。數(shù)據(jù)集是一組關(guān)于研究對(duì)象的描述。
如一條條告警消息就是數(shù)據(jù)集,每條告警消息是一個(gè)樣本。
二、樣本
樣本也叫示例,一組樣本組成一個(gè)數(shù)據(jù)集。
三、屬性
樣本會(huì)有很多屬性(或特征),如告警消息的觸發(fā)器,分組,分類等,屬性對(duì)應(yīng)的值叫屬性值。
四、屬性空間
屬性空間也叫樣本空間,或輸入空間。
假設(shè)告警消息有觸發(fā)器,分組,分類,告警級(jí)別四個(gè)屬性,每個(gè)屬性一個(gè)坐標(biāo)軸,那么四個(gè)屬性可以組成一個(gè)四維空間,每條告警消息都可以在這個(gè)空間中找到自己的坐標(biāo)位置。
五、特征向量
每個(gè)示例在空間中的坐標(biāo)向量
六、 輸入空間
一個(gè)樣本所有特征的集合
七、
D={x1→,x2→,?,xm→}D={x1→,x2→,?,xm→}:包含 m 個(gè)樣本的數(shù)據(jù)集
xi→=(xi1;xi2;?;xid)xi→=(xi1;xi2;?;xid):dd 維樣本空間 χχ 中的一個(gè)向量,xi→∈χ
xijxij:xi→xi→在第 jj 個(gè)屬性上的取值,后期可能會(huì)用 X? X→ 展示
dd:xi→xi→ 的“維數(shù) dimensionlity”
八、
學(xué)習(xí) learning/訓(xùn)練 training:從數(shù)據(jù)中學(xué)得模型的過程
訓(xùn)練數(shù)據(jù) training data:訓(xùn)練過程中使用的數(shù)據(jù)
訓(xùn)練樣本 training sample:訓(xùn)練中的每個(gè)樣本
假設(shè) hypothesis:學(xué)習(xí)模型對(duì)應(yīng)了關(guān)于數(shù)據(jù)某種潛在的規(guī)律
真相/真實(shí) ground-truth:潛在規(guī)律自身
學(xué)習(xí)器 learner:模型
預(yù)測(cè) prediction:獲得訓(xùn)練樣本的“結(jié)果”信息
標(biāo)記 label:樣本結(jié)果的信息
樣例 example:擁有標(biāo)記信息的樣本
(xi,yi)(xi,yi):第 ii 個(gè)樣例,yi∈Y? yi∈Y→ 是示例 xixi 的標(biāo)記,Y? Y→ 是所有標(biāo)記的集合
標(biāo)記空間 label space/輸出空間:所有標(biāo)記的集合
分類 classification:預(yù)測(cè)結(jié)果是離散值的學(xué)習(xí)任務(wù)
回歸 regression:預(yù)測(cè)結(jié)果是連續(xù)值的學(xué)習(xí)任務(wù)
二分類 binary calssification:涉及兩個(gè)類別
正類 positive class 和 反類 negative class:“二分類”中的兩個(gè)類別
多分類 multi-class classification:涉及多個(gè)類別
預(yù)測(cè)任務(wù):對(duì)訓(xùn)練集 {(x1→,y1),(x2→,y2),?,(xm→,ym)}{(x1→,y1),(x2→,y2),?,(xm→,ym)} 進(jìn)行學(xué)習(xí),建立一個(gè)從輸入空間 X? X→ 到 輸出空間 Y? Y→ 的映射 f:X? →Y? f:X→→Y→,通常令 Y? ={?1,+1}Y→={?1,+1} 或 {0,1}{0,1};對(duì)于多分類任務(wù),|Y? |>2|Y→|>2;對(duì)回歸任務(wù),|Y? |=R|Y→|=R,RR 為實(shí)數(shù)集
測(cè)試 testing:對(duì)學(xué)得模型進(jìn)行預(yù)測(cè)的過程
測(cè)試樣本 testing sample:被預(yù)測(cè)的樣本,例如學(xué)得 ff 后,對(duì)測(cè)試?yán)?nbsp;x? x→ ,可得到其預(yù)測(cè)標(biāo)記 y=f(x)y=f(x)
聚類 clustering:將訓(xùn)練集中的西瓜分成若干組
簇 cluster:“聚類”中的每一組。每一簇都可能對(duì)應(yīng)一些潛在的概念劃分并且這些概念我們事先是不知道的
泛化 generalization:學(xué)得模型適用于新樣本的能力
分布 distribution DD :通常假設(shè)樣本空間中全體服從一個(gè)未知“分布”
獨(dú)立同分布 independent and identically distributed i.i.d.i.i.d.:每個(gè)樣本都是獨(dú)立地從這個(gè)分布上采樣獲得的
科學(xué)推理的兩大基本手段:歸納 induction 與 演繹 deduction
歸納:從特殊到一般的“泛化 generalization”過程,即從具體的事實(shí)歸結(jié)出一般性規(guī)律
演繹:從一般到特殊的“特化 specialization”過程,即從基礎(chǔ)原理推演出具體狀況
歸納學(xué)習(xí) inductive learning:從樣例中學(xué)習(xí)
廣義歸納學(xué)習(xí):相當(dāng)于從樣例中學(xué)習(xí)
狹義歸納學(xué)習(xí):從訓(xùn)練數(shù)據(jù)中學(xué)得概念,因此也稱為“概念學(xué)習(xí)”或“概念形成”
布爾概念學(xué)習(xí):對(duì)“是”“不是”這樣的可表示為0/1布爾值的目標(biāo)概念的學(xué)習(xí)
學(xué)習(xí)過程:在所有假設(shè)組成的空間中進(jìn)行搜索的過程,搜索目標(biāo)是找到與訓(xùn)練集“匹配 fit”的假設(shè),
假設(shè)空間:能將訓(xùn)練集中的樣本判斷為正確的假設(shè)的集合
版本空間 version space:一個(gè)與訓(xùn)練集一致的“假設(shè)集合”
“版本空間”中可能有多個(gè)假設(shè)對(duì)應(yīng)訓(xùn)練集中的某個(gè)樣本,但是多個(gè)假設(shè)可能有不同的輸出,那么應(yīng)該采用哪一個(gè)模型(或假設(shè))呢?
歸納偏好 inductive bias:算法在學(xué)習(xí)過程中對(duì)某種類型假設(shè)的偏好
如果沒有歸納偏好:學(xué)得模型預(yù)測(cè)時(shí)時(shí)而告訴我們它是好的,時(shí)而告訴我們它是不好的
奧卡姆剃刀 Ocam’s razor:若有多個(gè)假設(shè)與觀察一致,則選最簡(jiǎn)單的那個(gè)
“沒有免費(fèi)的午餐”定理 No Free Lunch Theorem:無論學(xué)習(xí)算法 aa 多聰明、學(xué)習(xí)算法 bb 多笨拙,它們的期望性能都會(huì)相同。
NFL 定理前提:所有“問題”出現(xiàn)的機(jī)會(huì)相同、或所有問題同等重要
NFL 定理最重要的寓意:空泛的談“什么學(xué)習(xí)算法更好毫無意義”,因?yàn)槿艨紤]所有潛在的問題,則學(xué)習(xí)算法都一樣好
噪聲:出現(xiàn)不應(yīng)該出現(xiàn)的數(shù)據(jù),例如相同的屬性得出不一樣的分類
機(jī)器學(xué)習(xí)研究的主要內(nèi)容:在計(jì)算機(jī)中從數(shù)據(jù)中產(chǎn)生“模型 model”的算法,即“學(xué)習(xí)算法 learning algorithm”。
計(jì)算機(jī)科學(xué)研究“算法”;機(jī)器學(xué)習(xí)研究“學(xué)習(xí)算法”。
大多數(shù)時(shí)候算法的歸納偏好是否與問題本身匹配,直接決定了算法能否取得好的性能。
到此,關(guān)于“機(jī)器學(xué)習(xí)基本術(shù)語有哪些”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實(shí)踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識(shí),請(qǐng)繼續(xù)關(guān)注億速云網(wǎng)站,小編會(huì)繼續(xù)努力為大家?guī)砀鄬?shí)用的文章!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。