溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

SCWS中怎么添加自定義詞典

發(fā)布時間:2021-07-29 16:41:47 來源:億速云 閱讀:116 作者:Leah 欄目:web開發(fā)

本篇文章為大家展示了SCWS中怎么添加自定義詞典,內容簡明扼要并且容易理解,絕對能使你眼前一亮,通過這篇文章的詳細介紹希望你能有所收獲。

require_once __DIR__.'/func/my_curl_function.php';
require_once __DIR__.'/func/simple_html_dom.php';
$url='http://www.xunsearch.com/scws/demo/get_tfidf.php';
$header=array(
    "Referer:http://www.xunsearch.com/scws/demo/get_tfidf.php",
"Cookie:PHPSESSID=1fuk5j3ckb7n55s5j4cltk2sd3"
);
$f= fopen('tfidf.txt','r');
$i=0;
$html=new simple_html_dom();
while (!feof($f))
{
sleep(1);
  $contents = array();
    $contents = trim(fgets($f));
   if($contents=="")continue;
         //echo $contents;
    $data['data']=urlencode(trim($contents));
    $returndata=my_curl_post($url,$data,$header);
    //var_dump($returndata);
    //正則匹配出TF IDF
preg_match('/WORD=.*? TF=(.*?) IDF=(.*?)<br \/>/',$returndata,$ret);
$tf=$ret[1];
$idf=$ret[2];
echo "\n";
echo $contents."\t".$tf."\t".$idf."\tn\r\n";
//$html->load($returndata);
//$ps=$html->find('p');
//var_dump($ret);
file_put_contents("tfidf.out",$contents."\t".$tf."\t".$idf."\tn\r\n",FILE_APPEND);
}
fclose($f);

生成好自己的字典后就可以添加了

其實只要添加$so->add_dict('路徑',詞典);即可.

function scws_text($string)
{
$so = scws_new();
$so->set_charset('utf8');
$so->set_ignore(true);
$so->add_dict('/usr/local/scws/etc/dict.xdb',SCWS_XDICT_XDB);
$so->add_dict('/usr/local/scws/etc/dict.utf8.xdb',SCWS_XDICT_XDB);
$so->add_dict('/usr/local/scws/etc/mydict.txt',SCWS_XDICT_TXT);
$so->send_text($string);
$text ="";
while ($tmp = $so->get_result())
{
foreach($tmp as $key=>$value){
  //print_r($tmp);
 //$tmp .= $tmp;
$text .= $value['word']." ";
}
}
//print_r($text);
$so->close();
return $text;
}

上述內容就是SCWS中怎么添加自定義詞典,你們學到知識或技能了嗎?如果還想學到更多技能或者豐富自己的知識儲備,歡迎關注億速云行業(yè)資訊頻道。

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI