...求来说,对于人物英文名以3个字母为单位建立索引的确可以达到很好的效果,中文名以一个汉字为单位。 最后贴出我的代码给有需要的人: [php] class XSTokenizerUnary implements XSTokenizer { private $length = 1; // 默认切分长度 pub...
...mber) 目前来看,武汉都被分开了. 我的建议就是,scws是否可以针对不同的站点有不同的解决方案.比如汽车类型网站,游戏类型网站,就如同搜狗输入法的词库.我估计如果搜狗要是也能加入中文分词阵营,会是一个很大的挑战. 这...
...一点的信息,怎么个不行法。检索 的时候加上 --show-query 可以查看拆词结果 。 [/quote] 这样 还是搜不出结果 php Quest.php demo 1 在 3,000 条数据中,大约有 0 条包含 1 ,第 0-0 条,用时:0.0016 秒。 php Quest.php demo 1 --show-query ---...
...参数,但是没有在url里面传值。。。。 demo 项目在本地可以运行 search.php中的代码: $xs = new XS(`demo`); $search = $xs->search; $doc = $search->search("项目"); print_r($doc) 但是运行的时候报错,请问有可能是什么原因呢? Fatal error: Un...
... 恶俗 /n ? /un 大家 /r 怎么 /r 看 /v 的 /uj ? /un 后来发现可以通过修改rule.utf8.ini里的规则来调整分词结果,不知道有没有更好的办法?
...搜索日志记录。 记录完毕后存放在 $prefix/data//search.log 可以看看这个文件是否存在。
非常感谢大哥 重新弄了一下 居然可以了
...= 0.00) 请问:scws分词算法在X86处理器(CPU小端模式)上可以正确分词,scws怎么样才能在PPC等处理器上(CPU大端模式下)正确分词呢?
...典文件有好几个,dict.utf8.xdb,dict.xdb和dict_cht.utf8.xdb,我可以把这几个都装到etc文件夹里么?还有那几个ini文件也是一样的问题。 我已经在php.ini中这样配置了: extension = php_scws.dll scws.default.charset = gbk scws.default.fpath = "E:/APMServ...
...述的问题了。 其实就是用bin/xs-ctl.sh -b inet restart 重启就可以了....