溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

計(jì)算機(jī)中文本分類指的是什么意思

發(fā)布時間:2021-03-09 15:14:34 來源:億速云 閱讀:406 作者:小新 欄目:互聯(lián)網(wǎng)科技

小編給大家分享一下計(jì)算機(jī)中文本分類指的是什么意思,希望大家閱讀完這篇文章之后都有所收獲,下面讓我們一起去探討吧!

“文本分類”是自然語言處理的重要應(yīng)用,也可以說是最基礎(chǔ)的應(yīng)用。文本分類用電腦對文本集按照一定的分類體系或標(biāo)準(zhǔn)進(jìn)行自動分類標(biāo)記;它根據(jù)一個已被標(biāo)注的訓(xùn)練文檔集合,找到文檔特征和文檔類別間的關(guān)系模型,然后利用這種關(guān)系模型對新的文檔進(jìn)行類別判斷。

文本分類用電腦對文本集(或其他實(shí)體或物件)按照一定的分類體系或標(biāo)準(zhǔn)進(jìn)行自動分類標(biāo)記。 它根據(jù)一個已經(jīng)被標(biāo)注的訓(xùn)練文檔集合, 找到文檔特征和文檔類別之間的關(guān)系模型, 然后利用這種學(xué)習(xí)得到的關(guān)系模型對 新的文檔進(jìn)行類別判斷 。文本分類從基于知識的方法逐漸轉(zhuǎn)變?yōu)榛诮y(tǒng)計(jì) 和機(jī)器學(xué)習(xí)的方法。

文本分類一般包括了文本的表達(dá)、 分類器的選擇與訓(xùn)練、 分類結(jié)果的評價與反饋等過程,其中文本的表達(dá)又可細(xì)分為文本預(yù)處理、索引和統(tǒng)計(jì)、特征抽取等步驟。文本分類系統(tǒng)的總體功能模塊為:

(1) 預(yù)處理:將原始語料格式化為同一格式,便于后續(xù)的統(tǒng)一處理;

(2) 索引:將文檔分解為基本處理單元,同時降低后續(xù)處理的開銷;

(3) 統(tǒng)計(jì):詞頻統(tǒng)計(jì),項(xiàng)(單詞、概念)與分類的相關(guān)概率;

(4) 特征抽?。簭奈臋n中抽取出反映文檔主題的特征;

(5)分類器:分類器的訓(xùn)練;

(6) 評價:分類器的測試結(jié)果分析。

看完了這篇文章,相信你對“計(jì)算機(jī)中文本分類指的是什么意思”有了一定的了解,如果想了解更多相關(guān)知識,歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI