您好,登錄后才能下訂單哦!
這篇文章主要介紹“怎么在CSharp中調(diào)用HanLP”,在日常操作中,相信很多人在怎么在CSharp中調(diào)用HanLP問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”怎么在CSharp中調(diào)用HanLP”的疑惑有所幫助!接下來,請跟著小編一起來學(xué)習(xí)吧!
IKVM.NET是一款開源的Java虛擬機,可以將hanlp.jar類庫轉(zhuǎn)為dll直接供C#程序調(diào)用,也可以直接當(dāng)JVM讓hanlp.jar運行在.NET平臺上。請自行下載 IKVM ,本文使用的是ikvm-7.2.4630.5。
HanLP 是一個致力于向生產(chǎn)環(huán)境普及NLP技術(shù)的開源Java工具包,支持中文分詞(N-最短路分詞、CRF分詞、索引分詞、用戶自定義詞典、詞性標注),命名實體識別(中國人名、音譯人名、日本人名、地名、實體機構(gòu)名識別),關(guān)鍵詞提取,自動摘要,短語提取,拼音轉(zhuǎn)換,簡繁轉(zhuǎn)換,文本推薦,依存句法分析(MaxEnt依存句法分析、神經(jīng)網(wǎng)絡(luò)依存句法分析)。
HanLP由3部分組成:類庫hanlp.jar包、模型data包、配置文件hanlp.properties,請前往項目主頁下載最新版: https://github.com/hankcs/HanLP/releases
下載后,你需要編輯配置文件第一行的root指向data的父目錄, 詳見文檔 。
Native JVM情況下,我們是這樣調(diào)用hanlp.jar的,新建一個目錄(假定為C:\hanlp),把hanlp.jar和hanlp.properties放進去:
然后cd到這個目錄內(nèi),一句命令行:
java -cp .;hanlp-1.2.7.jar com.hankcs.hanlp.summary.TextRankSentence
就能運行成功了:
[無限算法的產(chǎn)生是由于未能確定的定義終止條件, 這類算法在有限的時間內(nèi)終止, 有限的非確定算法]
這里通過-cp選項指定了classpath為當(dāng)前目錄,這樣 HanLP 就能找到hanlp.properties了。
另外,在新版HanLP中,移除了所有的main方法,所以可能會報找不到main方法的異常。新版用戶不必糾結(jié)于命令行調(diào)用,直接寫代碼調(diào)用即可。
使用IKVM的話,只要將java換成ikvm即可:
C:\ikvm-7.2.4630.5\bin\ikvm -cp .;hanlp-1.2.7.jar com.hankcs.hanlp.summary.TextRankSentence
效果是一樣的:
CSharp是不能直接調(diào)用jar包的,需要轉(zhuǎn)為dll。IKVM提供了一個轉(zhuǎn)換工具ikvmc,使用方法如下:
C:\hanlp>C:\ikvm-7.2.4630.5\bin\ikvmc -target:library C:\hanlp\hanlp-1.2.7.jar
ikvmc會輸出消息:
IKVM.NET Compiler version 7.2.4630.5Copyright (C) 2002-2012 Jeroen Frijtershttp://www.ikvm.net/ note IKVMC0002: Output file is "hanlp-1.2.7.dll"
同時會在C:\hanlp目錄下生成hanlp-1.2.7.dll。
首先新建一個CSharp項目:
然后引用剛才生成的hanlp.dll和ikvm-7.2.4630.5\bin目錄下的IKVM.OpenJDK.Core.dll這兩個dll:
確定后就能在解決方案資源管理器中看到這兩個dll了:
雙擊hanlp還能進入到類視圖:
那么就可以愉快地寫代碼調(diào)用 HanLP 了:
using System;using System.Collections.Generic;using System.Linq;using System.Text;using System.Threading.Tasks;using com.hankcs.hanlp; namespace HanLPSharp{ class Program { static void Main(string[] args) { java.lang.System.getProperties().setProperty("java.class.path", "C:\\hanlp"); Console.WriteLine(HanLP.segment("你好,歡迎在CSharp中調(diào)用HanLP的API!")); Console.ReadKey(); } }}
解釋一下,
java.lang.System.getProperties().setProperty("java.class.path", "C:\\hanlp");
這句的作用是設(shè)置classpath到hanlp.properties所在的目錄,請根據(jù)情況自由調(diào)整。
編譯運行,效果如下:
這說明HanLP在CSharp中工作良好。
請參考HanLP的項目主頁: https://github.com/hankcs/HanLP
http://stackoverflow.com/questions/3466698/where-does-ikvm-get-its-classpath-from
http://www.ikvm.net/uses.html
到此,關(guān)于“怎么在CSharp中調(diào)用HanLP”的學(xué)習(xí)就結(jié)束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學(xué)習(xí),快去試試吧!若想繼續(xù)學(xué)習(xí)更多相關(guān)知識,請繼續(xù)關(guān)注億速云網(wǎng)站,小編會繼續(xù)努力為大家?guī)砀鄬嵱玫奈恼拢?/p>
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。