溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

什么是知識圖譜

發(fā)布時間:2021-10-18 17:15:30 來源:億速云 閱讀:483 作者:iii 欄目:web開發(fā)

這篇文章主要介紹“什么是知識圖譜”,在日常操作中,相信很多人在什么是知識圖譜問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”什么是知識圖譜”的疑惑有所幫助!接下來,請跟著小編一起來學習吧!

01 什么是知識圖譜

我們可以從不同的視角去審視知識圖譜的概念。

  • 在Web視角下,知識圖譜如同簡單文本之間的超鏈接一樣,通過建立數(shù)據(jù)之間的語義鏈接,支持語義搜索。

  • 在自然語言處理視角下,知識圖譜就是從文本中抽取語義和結構化的數(shù)據(jù)。

  • 在知識表示視角下,知識圖譜是采用計算機符號表示和處理知識的方法。

  • 在人工智能視角下,知識圖譜是利用知識庫來輔助理解人類語言的工具。

  • 在數(shù)據(jù)庫視角下,知識圖譜是利用圖的方式去存儲知識的方法。

目前,學術界還沒有給知識圖譜一個統(tǒng)一的定義。在谷歌發(fā)布的文檔中有明確的描述,知識圖譜是一種用圖模型來描述知識和建模世界萬物之間關聯(lián)關系的技術方法。

知識圖譜還是比較通用的語義知識的形式化描述框架,它用節(jié)點表示語義符號,用邊表示語義之間的關系,如圖3-1所示。在知識圖譜中,人、事、物通常被稱作實體或本體。

什么是知識圖譜

▲圖3-1 知識圖譜示例

知識圖譜的組成三要素包括:實體、關系和屬性。

  • 實體:又叫作本體(Ontology),指客觀存在并可相互區(qū)別的事物,可以是具體的人、事、物,也可以是抽象的概念或聯(lián)系。實體是知識圖譜中最基本的元素。

  • 關系:在知識圖譜中,邊表示知識圖譜中的關系,用來表示不同實體間的某種聯(lián)系。如圖3-1所示,圖靈和人工智能之間的關系,知識圖譜和谷歌之間的關系,谷歌和深度學習之間的關系。

  • 屬性:知識圖譜中的實體和關系都可以有各自的屬性,如圖3-2所示。

什么是知識圖譜

▲圖3-2 知識圖譜中的屬性

知識圖譜的構建涉及知識建模、關系抽取、圖存儲、關系推理、實體融合等多方面技術。知識圖譜的應用則體現(xiàn)在語義搜索、智能問答、語言理解、決策分析等多個領域。

02 知識圖譜的價值

知識圖譜最早應用于搜索引擎,一方面通過推理實現(xiàn)概念檢索,另一方面以圖形化方式向用戶展示經(jīng)過分類整理的結構化知識,從而使人們從人工過濾網(wǎng)頁尋找答案的模式中解脫出來,可應用到智能問答、自然語言理解、推薦等方面。

知識圖譜的發(fā)展得益于Web技術的發(fā)展,受KR、NLP、Web以及AI等方面的影響。知識圖譜的價值歸根結底是為了讓AI變得更智慧。

1. 助力搜索

搜索的目的是在萬物互聯(lián)的網(wǎng)絡中,能夠使人們方便、快速地找到某一事物。目前,我們的搜索習慣和搜索行為仍然是以關鍵詞為搜索目的,知識圖譜的出現(xiàn)可以徹底改變這種搜索行為模式。

在知識圖譜還沒有應用到搜索引擎上時,搜索的流程是:從海量的URL中找出與查詢匹配度最高的URL,按照查詢結果把排序分值最高的一些結果返回給用戶。在整個過程中,搜索引擎可能并不需要知道用戶輸入的是什么,因為系統(tǒng)不具備推理能力,在精準搜索方面也略顯不足。

而基于知識圖譜的搜索,除了能夠直接回答用戶的問題外,還具有一定的語義推理能力,大大提高了搜索的精確度。圖3-3所示是知識圖譜助力搜索示意圖。

什么是知識圖譜

▲圖3-3 知識圖譜助力搜索

2. 助力推薦

推薦技術和搜索技術非常相似,但是稍有區(qū)別。搜索技術采用信息拉取的方式,而推薦技術采用信息推送的方式,所以在推薦技術中有一些問題,比如冷啟動和數(shù)據(jù)稀疏問題。

以電商推薦為例介紹知識圖譜在推薦上的應用。假設我買了手機,手機的強下位關系是手機殼,這樣系統(tǒng)就可以給我推薦手機殼,同時也可以推薦相似或互補的實體。圖3-4為知識圖譜助力推薦示意圖。

什么是知識圖譜

▲圖3-4 知識圖譜助力推薦

3. 助力問答

問答與對話系統(tǒng)一直是NLP在人工智能實現(xiàn)領域的關鍵標志之一。知識圖譜相當于是給問答與對話系統(tǒng)掛載了一個背景知識庫。

對于問答與對話系統(tǒng)或者聊天機器人來說,其除了需要實體知識圖譜和興趣知識圖譜等開放領域的稀疏大圖外,還需要針對機器人和用戶個性化的稠密小圖。同時,知識圖譜是需要動態(tài)更新的。圖3-5是知識圖譜助力問答示意圖。

什么是知識圖譜

▲圖3-5 知識圖譜助力問答

03 知識圖譜的架構

知識圖譜的架構涉及知識表示、知識獲取、知識處理和知識利用等多個方面。

一般情況下,知識圖譜構建流程如下:首先確定知識表示模型,然后根據(jù)不同的數(shù)據(jù)來源選擇不同的知識獲取手段并導入相關的知識,接著利用知識推理、知識融合、知識挖掘等技術構建相應的知識圖譜,最后根據(jù)不同應用場景設計知識圖譜的表現(xiàn)方式,比如:語義搜索、智能推薦、智能問答等。

從邏輯上,我們可以將知識圖譜劃分為兩個層次:數(shù)據(jù)層和模式層。數(shù)據(jù)層可以是以事實為單位存儲的數(shù)據(jù)庫,可以選用的圖數(shù)據(jù)庫有RDF4j、Virtuoso、Neo4j等三元組。

<實體,關系,實體>或者<實體,屬性,屬性值>可以作為基本的表達方式,存儲在圖數(shù)據(jù)庫中。模式層建立在數(shù)據(jù)層之上,是知識圖譜的核心。通常,通過本體庫來管理數(shù)據(jù)層,本體庫的概念相當于對象中“類”的概念。借助本體庫,我們可以管理公理、規(guī)則和約束條件,規(guī)范實體、關系、屬性這些具體對象間的關系。

知識圖譜有自頂向下和自底向上兩種構建方式。自頂向下構建是指借助百科類數(shù)據(jù)源,提取本體和模式信息,并加入知識庫中。自底向上構建是指借助一定的技術手段,從公開的數(shù)據(jù)中提取資源,選擇其中置信度較高的信息,經(jīng)人工審核后,加入知識庫中。

在知識圖譜發(fā)展初期,多數(shù)企業(yè)和機構采用自頂向下的方式構建知識圖譜,目前大多企業(yè)采用自底向上的方式構建知識圖譜。

知識圖譜的架構如圖3-6所示。

什么是知識圖譜

▲圖3-6 知識圖譜的架構

  • 知識源:包括結構化數(shù)據(jù)、非結構化數(shù)據(jù)和半結構化數(shù)據(jù)。

  • 信息抽取:就是從各種類型的數(shù)據(jù)源中提取實體、屬性以及實體間的相互關系,在此基礎上形成本體的知識表述。知識圖譜的構建過程中存在大量的非結構化或者是半結構化數(shù)據(jù),這些數(shù)據(jù)在知識圖譜的構建過程中需要通過自然語言處理的方法進行信息抽取。從這些數(shù)據(jù)中,我們可以提取出實體、關系和屬性。

  • 知識融合:主要工作是把結構化的數(shù)據(jù)以及信息抽取提煉到的實體信息,甚至第三方知識庫進行實體對齊和實體消歧。這一階段的輸出應該是從各個數(shù)據(jù)源融合的各種本體信息。

  • 知識加工:知識加工階段如圖3-6所示,其中知識推理中重要的工作就是知識圖譜的補全。常用的知識圖譜的補全方法包括:基于本體推理的補全方法、相關的推理機制實現(xiàn)以及基于圖結構和關系路徑特征的補全方法。

到此,關于“什么是知識圖譜”的學習就結束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續(xù)學習更多相關知識,請繼續(xù)關注億速云網(wǎng)站,小編會繼續(xù)努力為大家?guī)砀鄬嵱玫奈恼拢?/p>

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內容。

AI