scws_set_dict($so, '/dict.utf8.xdb'); scws_set_rule($so, '/rules.utf8.ini'); 问题在这里!!
...8.cht.php[/url] 引擎本身不需要更改, 只需要将rules.utf8.ini和dict.utf8.xdb改为繁体的词典即可. 词典制作参见相关代码里的工具 scws-1.0 里包含了词典制作工具. 顺便奉上之前整理制作的繁体数据. [url]http://www.hightman.cn/down/rules_cht.utf...
ubuntu下,我把scws装成php的扩展, php调用时, $so->set_dict(ini_get("scws.default.fpath")."/dict.utf8.xdb",SCWS_XDICT_MEM); 如果去掉SCWS_XDICT_MEM,则分割同样的字符串时间增加, 请教这种模式的原理, apache 以loadmodule跑php,一次页面执行完毕后...
[quote='hightman' pid='4118' dateline='1300201925'] set_dict("d:\test.xdb", SCWS_XDICT_XDB); 应该是这样而不是加引号 [/quote] 哦,写错了,确实是按斑斑写的呢样调用的,换成版版得字典就没问题,用我自定义的结果就是空[hr] 还有 set_dict("d:\test....
...ws->set_rule(ini_get('scws.default.fpath') . '/rules.utf8.ini'); $cws->set_dict(ini_get('scws.default.fpath') . '/dict.utf8.xdb'); 再次运行,分词正确了[hr] 不过,又出现了奇怪的问题,我在原来的测试文本后面随便加了两个字母,分词又不对了。我继续增...
你要用自定义词库 编写一个 dict_extra.txt 里面写上每个词,一个一行 然后调用 add_dict 加入词典
自定义了dict_user.txt 出现奇怪现象,所有词性都变成了string(3),而且还出现了乱码: array(3) { ["off"]=> int(0) ["attr"]=> string(3) "@�" ["word"]=> string(15) "重庆鸡公煲" } array(3) { ["off"]=> int(0) ["attr"]=> string(3) "ns�" ["word"]=> string(6) "重庆" ...
我想在$prefix/etc/dict_user.txt内添加一些自定义词汇,有几个问题: 1、添加完是否需要重启xunsearch主进程?(实验结果是,求确认) 2、只监视dict_user.txt,还是会扫描、装载etc目录下所有的txt? 3、自定义词库后,系统内置词库...
...文件如下 (假设 $prefix 是您的安装目录) ~~~ $prefix/etc/dict_user.txt ~~~ 打开上述文件,文件开头已经有了相关注释和说明。这个文件就是自定义词库文件, 如果您同一台机器上装有多个 xunsearch 服务端,那么每个服务端独自使用...
...有空 空间” 但实际结果是“有空 间” 即使通过scws_add_dict()添加了自定义的txt字典(里面只包含“空间 11.82 12.38”一行),仍然分不出“空间”这个词。 还有如何设置才能识别出网址和邮箱等格式? 另外关于scws-gen-dict,...