我在分词中没加$so->add_dict("dict.xdb",SCWS_XDICT_XDB); $so->add_dict("dict.txt",SCWS_XDICT_TXT); 这个情况下“云计算”分词如下:"云 计算"。我加了$so->add_dict("dict.xdb",SCWS_XDICT_XDB); $so->add_dict("dict.txt",SCWS_XDICT_TXT); 并在txt文件中加入 “...
hightman: 补丁我试图去打了,但出现以下错误: patch -c libscws/scws.c scws.patch patching file libscws/scws.c Hunk #1 FAILED at 328. Hunk #2 FAILED at 684. 2 out of 2 hunks FAILED -- saving rejects to file libscws/scws.c.rej 补丁针对的版本是scws-1.5吗?
测试代码如下,导致搜索:塔里木,会搜索不到结果。 require_once '/home/wlx/xunsearch/sdk/php/lib/XS.php'; $xs=new XS('westdc'); $tokenizer = new XSTokenizerScws; $text = '塔里木河下游浅层地下水变化的生态效应及生态系统健康评价研究项目的...
麻烦看下: 例如: 跑马的时候非常的卡 跑马-的-时候-非常-的卡 最后分出来的"的卡"很明显是不正确的,请问下是否有办法解决, 应该是分成"跑马-的-时候-非常-的-卡" 感谢!!![hr] 我找到了楼主原先的一个回复: 建议把这...
sdk/php/app/demo.ini配置 [php] [id] type = id [productsName] type = title tokenizer = scwsSplit [/php] 自定义字母、数字分词类 sdk/php/lib/XSTokenizerScwsSplit.php [php]
那如果要在后台php页面上建立索引,要如何操作呢?如下终端(ssh中执行的)语句:/usr/local/xunsearch/sdk/php/util/Indexer.php --rebuild --source=mysql://root:111111@localhost/dbo --sql="select * from user" --project=sokc,怎么写php脚本(类似后台的东西...
这里需要用到 set_multi,不过鉴于该词先单字后多字,所以达不到“云“+”计算“的效果。 使用 txt 附加词典时请显式地先指定 xdb 词典,以便 txt 词典后生效。 $so->add_dict('dict.xdb', SCWS_XDICT_XDB); $so->add_dict('dict.txt', SCWS_XDICT_TXT); [c...
又一个分词错误“陈明真在《苍天有泪》中扮 演谁啊?求陈明真的个人介绍”分成"陈明真/nr 在/p 《/un 苍天有泪/n 》/un 中/f 扮演/v 谁/r 啊/e ?/un 求/v 陈明/nr 真的/d 个人/n 介绍/v",其中“陈明 真的"这里有误
...目运作中,网友发现部分情况搜索结果不全。经仔细排查问题在于 scws 分词中。 当采用非内存模式的词典时,返回的查结结果中(word_st)...->flag的属性包含怕 SCWS_WORD_MALLOCED 与 SCWS_ZFLAG_SYMBOL 定义冲突,以至于被当作符号文字从...