溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

計(jì)算機(jī)中自然語(yǔ)言處理指的是什么

發(fā)布時(shí)間:2021-02-04 10:09:00 來(lái)源:億速云 閱讀:1131 作者:小新 欄目:互聯(lián)網(wǎng)科技

這篇文章主要介紹了計(jì)算機(jī)中自然語(yǔ)言處理指的是什么,具有一定借鑒價(jià)值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。

自然語(yǔ)言處理是一門(mén)融語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)于一體的科學(xué)。自然語(yǔ)言處理主要應(yīng)用于機(jī)器翻譯、輿情監(jiān)測(cè)、自動(dòng)摘要、觀點(diǎn)提取、文本分類(lèi)、問(wèn)題回答、文本語(yǔ)義對(duì)比、語(yǔ)音識(shí)別、中文OCR等方面。

自然語(yǔ)言處理( Natural Language Processing, NLP)是一門(mén)融語(yǔ)言學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)于一體的科學(xué)。

自然語(yǔ)言處理是指利用人類(lèi)交流所使用的自然語(yǔ)言與機(jī)器進(jìn)行交互通訊的技術(shù)。通過(guò)人為的對(duì)自然語(yǔ)言的處理,使得計(jì)算機(jī)對(duì)其能夠可讀并理解。自然語(yǔ)言處理的相關(guān)研究始于人類(lèi)對(duì)機(jī)器翻譯的探索。雖然自然語(yǔ)言處理涉及語(yǔ)音、語(yǔ)法、語(yǔ)義、語(yǔ)用等多維度的操作,但簡(jiǎn)單而言,自然語(yǔ)言處理的基本任務(wù)是基于本體詞典、詞頻統(tǒng)計(jì)、上下文語(yǔ)義分析等方式對(duì)待處理語(yǔ)料進(jìn)行分詞,形成以最小詞性為單位,且富含語(yǔ)義的詞項(xiàng)單元。

自然語(yǔ)言處理以語(yǔ)言為對(duì)象,利用計(jì)算機(jī)技術(shù)來(lái)分析、理解和處理自然語(yǔ)言的一門(mén)學(xué)科,即把計(jì)算機(jī)作為語(yǔ)言研究的強(qiáng)大工具,在計(jì)算機(jī)的支持下對(duì)語(yǔ)言信息進(jìn)行定量化的研究,并提供可供人與計(jì)算機(jī)之間能共同使用的語(yǔ)言描寫(xiě)。包括自然語(yǔ)言理解( NaturalLanguage Understanding, NLU)和自然語(yǔ)言生成( Natural LanguageGeneration, NLG)兩部分。它是典型邊緣交叉學(xué)科,涉及到語(yǔ)言科學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)、認(rèn)知學(xué)、邏輯學(xué)等,關(guān)注計(jì)算機(jī)和人類(lèi)(自然)語(yǔ)言之間的相互作用的領(lǐng)域。人們把用計(jì)算機(jī)處理自然語(yǔ)言的過(guò)程在不同時(shí)期或側(cè)重點(diǎn)不同時(shí)又稱為自然語(yǔ)言理解( Natural Language Understanding, NLU)、人類(lèi)語(yǔ)言技術(shù)( Human Language Technology, HLT)、計(jì)算語(yǔ)言學(xué)Hl(Computational Linguistics)、計(jì)量語(yǔ)言學(xué)( QuantitativeLinguistics)、數(shù)理語(yǔ)言學(xué)( Mathematical Linguistics)。

實(shí)現(xiàn)人機(jī)間自然語(yǔ)言通信意味著要使計(jì)算機(jī)既能理解自然語(yǔ)言文本的意義,也能以自然語(yǔ)言文本來(lái)表達(dá)給定的意圖、思想等。前者稱為自然語(yǔ)言理解,后者稱為自然語(yǔ)言生成。因此,自然語(yǔ)言處理大體包括了自然語(yǔ)言理解和自然語(yǔ)言生成兩個(gè)部分。歷史上對(duì)自然語(yǔ)言理解研究得較多,而對(duì)自然語(yǔ)言生成研究得較少。但這種狀況已有所改變。

相關(guān)

無(wú)論實(shí)現(xiàn)自然語(yǔ)言理解,還是自然語(yǔ)言生成,都遠(yuǎn)不如人們?cè)瓉?lái)想象的那么簡(jiǎn)單,而是十分困難的。從現(xiàn)有的理論和技術(shù)現(xiàn)狀看,通用的、高質(zhì)量的自然語(yǔ)言處理系統(tǒng),仍然是較長(zhǎng)期的努力目標(biāo),但是針對(duì)一定應(yīng)用,具有相當(dāng)自然語(yǔ)言處理能力的實(shí)用系統(tǒng)已經(jīng)出現(xiàn),有些已商品化,甚至開(kāi)始產(chǎn)業(yè)化。典型的例子有:多語(yǔ)種數(shù)據(jù)庫(kù)和專家系統(tǒng)的自然語(yǔ)言接口、各種機(jī)器翻譯系統(tǒng)、全文信息檢索系統(tǒng)、自動(dòng)文摘系統(tǒng)等。

自然語(yǔ)言處理,即實(shí)現(xiàn)人機(jī)間自然語(yǔ)言通信,或?qū)崿F(xiàn)自然語(yǔ)言理解和自然語(yǔ)言生成是十分困難的。造成困難的根本原因是自然語(yǔ)言文本和對(duì)話的各個(gè)層次上廣泛存在的各種各樣的歧義性或多義性(ambiguity)。

自然語(yǔ)言的形式(字符串)與其意義之間是一種多對(duì)多的關(guān)系。其實(shí)這也正是自然語(yǔ)言的魅力所在。但從計(jì)算機(jī)處理的角度看,我們必須消除歧義,而且有人認(rèn)為它正是自然語(yǔ)言理解中的中心問(wèn)題,即要把帶有潛在歧義的自然語(yǔ)言輸入轉(zhuǎn)換成某種無(wú)歧義的計(jì)算機(jī)內(nèi)部表示。

歧義現(xiàn)象的廣泛存在使得消除它們需要大量的知識(shí)和推理,這就給基于語(yǔ)言學(xué)的方法、基于知識(shí)的方法帶來(lái)了巨大的困難,因而以這些方法為主流的自然語(yǔ)言處理研究幾十年來(lái)一方面在理論和方法方面取得了很多成就,但在能處理大規(guī)模真實(shí)文本的系統(tǒng)研制方面,成績(jī)并不顯著。研制的一些系統(tǒng)大多數(shù)是小規(guī)模的、研究性的演示系統(tǒng)。

目前存在的問(wèn)題有兩個(gè)方面:一方面,迄今為止的語(yǔ)法都限于分析一個(gè)孤立的句子,上下文關(guān)系和談話環(huán)境對(duì)本句的約束和影響還缺乏系統(tǒng)的研究,因此分析歧義、詞語(yǔ)省略、代詞所指、同一句話在不同場(chǎng)合或由不同的人說(shuō)出來(lái)所具有的不同含義等問(wèn)題,尚無(wú)明確規(guī)律可循,需要加強(qiáng)語(yǔ)用學(xué)的研究才能逐步解決。另一方面,人理解一個(gè)句子不是單憑語(yǔ)法,還運(yùn)用了大量的有關(guān)知識(shí),包括生活知識(shí)和專門(mén)知識(shí),這些知識(shí)無(wú)法全部貯存在計(jì)算機(jī)里。因此一個(gè)書(shū)面理解系統(tǒng)只能建立在有限的詞匯、句型和特定的主題范圍內(nèi);計(jì)算機(jī)的貯存量和運(yùn)轉(zhuǎn)速度大大提高之后,才有可能適當(dāng)擴(kuò)大范圍.

以上存在的問(wèn)題成為自然語(yǔ)言理解在機(jī)器翻譯應(yīng)用中的主要難題,這也就是當(dāng)今機(jī)器翻譯系統(tǒng)的譯文質(zhì)量離理想目標(biāo)仍相差甚遠(yuǎn)的原因之一;而譯文質(zhì)量是機(jī)譯系統(tǒng)成敗的關(guān)鍵。中國(guó)數(shù)學(xué)家、語(yǔ)言學(xué)家周海中教授曾在經(jīng)典論文《機(jī)器翻譯五十年》中指出:要提高機(jī)譯的質(zhì)量,首先要解決的是語(yǔ)言本身問(wèn)題而不是程序設(shè)計(jì)問(wèn)題;單靠若干程序來(lái)做機(jī)譯系統(tǒng),肯定是無(wú)法提高機(jī)譯質(zhì)量的;另外在人類(lèi)尚未明了大腦是如何進(jìn)行語(yǔ)言的模糊識(shí)別和邏輯判斷的情況下,機(jī)譯要想達(dá)到“信、達(dá)、雅”的程度是不可能的。

感謝你能夠認(rèn)真閱讀完這篇文章,希望小編分享的“計(jì)算機(jī)中自然語(yǔ)言處理指的是什么”這篇文章對(duì)大家有幫助,同時(shí)也希望大家多多支持億速云,關(guān)注億速云行業(yè)資訊頻道,更多相關(guān)知識(shí)等著你來(lái)學(xué)習(xí)!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI