溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

如何使用PHP的FFI調(diào)用cjieba

發(fā)布時(shí)間:2020-11-20 09:47:19 來源:億速云 閱讀:139 作者:小新 欄目:編程語言

這篇文章主要介紹如何使用PHP的FFI調(diào)用cjieba,文中介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們一定要看完!

                                                           

phpjieba_ffi

使用PHP 7.4的 FFI 測試直接調(diào)用cjieba分詞的動(dòng)態(tài)庫

選用CJieba的原因是FFI使用的是C的調(diào)用約定,如果用Cpp,還得自己包裝一下,然后extern C,讓編譯器生成標(biāo)準(zhǔn)C的動(dòng)態(tài)庫。

碰到的問題

段錯(cuò)誤

C變量沒有初始化

直接調(diào)用了C的函數(shù),沒有通過FFI 初始化后的的C對(duì)象調(diào)用

非空判斷 需要使用 FFI::isNull($x)

指針形式的數(shù)組 不能用foreach

指針形式數(shù)組的循環(huán)

查看C代碼發(fā)現(xiàn)Cut部分如下:

CJiebaWord* Cut(Jieba handle, const char* sentence, size_t len) {
  cppjieba::Jieba* x = (cppjieba::Jieba*)handle;
  vector<string> words;
  string s(sentence, len);
  x->Cut(s, words);
  
  CJiebaWord* res = (CJiebaWord*)malloc(sizeof(CJiebaWord) * (words.size() + 1));
  size_t offset = 0;
  for (size_t i = 0; i < words.size(); i++) {
    res[i].word = sentence + offset;
    res[i].len = words[i].size();
    offset += res[i].len;
  }
  if (offset != len) {
    free(res);
    return NULL;
  }
  res[words.size()].word = NULL;
  res[words.size()].len = 0;
  return res;
}

返回的是一個(gè)結(jié)構(gòu)體指針,在C語言里,數(shù)組名實(shí)際是數(shù)組第一個(gè)變量的指針地址,所以可以通過指針地址++的操作來遍歷,在FFI里面呢?

對(duì)于這個(gè)數(shù)組,我一開始用foreach 循環(huán),直接報(bào)段錯(cuò)誤了,后來和C一樣,直接用指針++,發(fā)現(xiàn)是可行的,這里給FFI點(diǎn)贊,居然也可以直接操作C指針。

分詞結(jié)果獲取

如上面的代碼,對(duì)于單個(gè)分詞CJiebaWord,也不是保存的分詞,而是sentence + offset,就是說第一個(gè)分詞結(jié)果肯定是原始字符串。

在C的demo里是printf格式化(. 表示字段寬度和對(duì)齊),但是PHP里沒有類似的方法,需要截取字符串substr($x->word, 0, $x->len)

  for (x = words; x->word; x++) {
    printf("%*.*s\n", x->len, x->len, x->word);
  }

用法示例

編譯動(dòng)態(tài)庫

make libjieba.so

運(yùn)行

time php demo.php

運(yùn)行c demo

make demo
time ./demo

結(jié)果

PHP
load: 0.00025701522827148
real    1m59.619s
user    1m56.093s
sys     0m3.517s
C
real    1m54.738s
user    1m50.382s
sys     0m4.323s
CPU 占用 基本都是 12%

可以發(fā)現(xiàn)使用FFI,PHP的速度基本和C差不多,如有CPU占用大的業(yè)務(wù),可以嘗試使用其它語言(C/C++,golang,Rust等)編寫然后導(dǎo)出標(biāo)準(zhǔn)C的動(dòng)態(tài)庫。

FFI的用途

在沒有FFI之前,需要系統(tǒng)調(diào)用或者sdk方式調(diào)用的地方,PHP就需要開發(fā)擴(kuò)展,但是開發(fā)擴(kuò)展不僅需要理解C語言,還得了解PHP內(nèi)核,比較困難。 現(xiàn)在就方便多了,直接使用FFI調(diào)用動(dòng)態(tài)庫即可。

擴(kuò)展 宏展開

比如??档膕dk里有大量的宏 gcc -E -P HCNetSDK.h -o HCNetSDK_unfold.h 支持 type define 放心使用

以上是如何使用PHP的FFI調(diào)用cjieba的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對(duì)大家有幫助,更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI