您好,登錄后才能下訂單哦!
如何使用PageOffice進(jìn)行Word文檔全文檢索,相信很多沒有經(jīng)驗(yàn)的人對(duì)此束手無策,為此本文總結(jié)了問題出現(xiàn)的原因和解決方法,通過這篇文章希望你能解決這個(gè)問題。
Word文檔與日常辦公密不可分,在實(shí)際應(yīng)用中,當(dāng)某一文檔服務(wù)器中有很多Word文檔,假如有成千上萬個(gè)文檔時(shí),用戶查找打開包含某些指定關(guān)鍵字的文檔就變得很困難,目前網(wǎng)絡(luò)上能找到的解決方案多是使用服務(wù)器端的Apache POI技術(shù)將所有文檔的文本獲取后存儲(chǔ)到數(shù)據(jù)庫,然后打開文檔時(shí)利用sql語句檢索文檔是否包含關(guān)鍵字來判斷是否是打開文檔。但是這種解決辦法有很大的弊端,首先POI技術(shù)對(duì)word文檔支持不是很好,其中支持word的接口單一而且不太穩(wěn)定,對(duì)word文檔的格式也要求很高。其次如果將成千上萬個(gè)文檔使用poi將其文本內(nèi)容存儲(chǔ)到數(shù)據(jù)庫這一操作將會(huì)在很大程度上影響服務(wù)器的性能。
PageOffice提供了獲取Word文檔全文純文本的功能,可以把獲取到的文本內(nèi)容保存到數(shù)據(jù)庫,利用數(shù)據(jù)庫sql語句檢索文檔是否包含關(guān)鍵字來實(shí)現(xiàn)這一需求。PageOffice獲取文檔純文本的工作是客戶端執(zhí)行的,這樣就在很大程度上減輕了對(duì)服務(wù)器的壓力,提高了服務(wù)器的性能。
獲取Word文檔中的純文本文件(不帶任何附加格式)并保存到數(shù)據(jù)庫,以后就可以簡(jiǎn)單的利用SQL查詢輕松實(shí)現(xiàn)文檔管理中的全文檢索功能。
Java代碼:
FileSaver fs = new FileSaver(request, response); String strDocumentText = fs.getDocumentText(); // 您可以把此文本字符串保存到數(shù)據(jù)庫字段。保存到數(shù)據(jù)庫的代碼此處省略 fs.saveToFile(request.getRealPath("doc/") + "/" + fs.getFileName()); fs.Close();
ASP.NET代碼:
PageOffice.FileSaver fs = new PageOffice.FileSaver(); string strDocumentText = fs.DocumentText; // 您可以把此文本字符串保存到數(shù)據(jù)庫字段。保存到數(shù)據(jù)庫的代碼此處省略 fs.SaveToFile(Server.MapPath("doc/") + fs.FileName); fs.Close();
注意:此屬性目前僅適用于Word。
請(qǐng)參考PageOffice開發(fā)包中Samples4示例的綜合演示:
三、全文搜索包含關(guān)鍵字的Word文檔(專業(yè)版、企業(yè)版)
獲取文檔中的純文本保存到數(shù)據(jù)庫,根據(jù)關(guān)鍵字檢索文檔中是否包含該關(guān)鍵字。
數(shù)據(jù)庫中的文檔的存儲(chǔ)結(jié)構(gòu)說明(以access數(shù)據(jù)庫為例)。
搜索包含關(guān)鍵字的文檔,以列表顯示文檔名。
高亮顯示的主要js代碼:
var sMac = "function myfunc()">
看完上述內(nèi)容,你們掌握如何使用PageOffice進(jìn)行Word文檔全文檢索的方法了嗎?如果還想學(xué)到更多技能或想了解更多相關(guān)內(nèi)容,歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。