比如我要搜索 E14188m 这个词的时候,能搜索到。 但是当我要搜索 E1418的时候却无法搜索到。希望能够配置数字当做字符串
这是分词的策略问题,这种情况可以自定义分词器来补充。。。 将你的词复制到 [url]http://www.xunsearch.com/scws/demo/v4.php[/url] 进行实测,分割结果为: E14188m E14188 14188 14188m 那么搜索以上4个词都是可以搜索到的,至于你从中提取 e...
... header("Content-type: text/html; charset=utf-8"); var_dump(SCWS('中文分词解析,我的个神啊')); //中文分词解析 function SCWS($title) { set_time_limit(0); $data = array("data"=>$title,"respond"=>"json","ignore"=>'yes', "multi"=>3); $data = http_build_query($data); $re = w...
数据量太大了,导致分词搜索结果数太多,反而不精准了。 所以想在某些情况下可以关闭分词功能,输入的是什么就搜索什么。 翻到了这个帖子 http://bbs.xunsearch.com/showthread.php?tid=2141&pid=4025#pid4025 根据回复是设置为0即可,...
...ite【子目录】 |---include【子目录】 |---使用分词功能的页面.php【php代码调用正确:"../etc/自定义词典.txt"】 |---etc【子目录】 |---自定义词典.txt |---admin【子目录】 |---include【子目录】 ...
...是SCWS-1.2.2 我用自己的词库替换了dict.utf8.xdb,然后尝试分词“朝鲜近日播放的一个纪录片中,发现”,发现“纪录片中”在分词结果中丢失了 Array ( [word] => 朝鲜 [off] => 0 [len] => 6 [idf] => 0 [attr] => @ ) Array ( [word] => 近日 [off] => 6 ...
...能够正常的被php加载上去了。 但是现在有个问题是 无法分词,情况是这样的: 1. 按照统计形式分词,返回结果为空 2. 而按照非统计形式分词,结果是单字,没有词组。 3.回头去查,发现原来安装的另外一台32位的1.1.1版本的分...
词典没有正确放置或设置吧,看看你的 php.ini 中关于 scws.default.fpath 的设置
...用,估计是配置差别导致。经过反复对比,确定和字段的分词策略设置有关。 起初对于分类id这个字段,我认为设置成type=numeric index=full就行,从实验看,需要设置成index=self(默认采用scws分词),这样就达到了目的。 不过还...