... scws 对于分词 xunsearch 可以通过 XSTokenizer 扩展 我想问的是 既然是 集成scws 那么 1.有没有提供scws的api接口,实现短语分词功能 2.是否可以对scws自定义中文词典,方便扩展 [/quote] 目前没有直接支持自定义词典,而是直接读取 ...
...=== 检查内容 -------- 本程序用于确认您的服务器配置是否能满足运行 Xunsearch PHP-SDK 的要求。 它将检查服务器所运行的 PHP 版本,查看是否安装了合适的PHP扩展模块,以及 确认 php.ini 文件是否正确设置。 +------------+--------...
...的php_Scws.dll因缺省编译环境和经验本人未能编译, 以前都是由网友bin友情编译... 如果您的词汇是属于通用的词汇, 您可以将词表发到论坛里, 我会集中统一更新词典
问题已经搞明白,非常感谢 hightman :) db_o, 是备份数据, 再次clean会替换掉。留 着有备无患没有用的你也可以手动删除。 非常感谢。
词库没有正确加载,你检查一下 /usr/local/scws/etc/ 下的 .xdb 的文件属性,默认.tar.bz2 解开有可能是600,建议 chmod a+r /usr/local/scws/etc/*
目前还没针对PHP5.3进行测试, 看提示的意思应该是新的php 5.3 已经取消了 ZVAL_ADDREF 这个宏.. 稍后我会测试一下
...譬如“美女” ,用scws_get_tops分出来的词中有这个词,但是scws_has_word却判断为不包含这个词。 但是大部分自定义词库中的词还是能用scws_has_word判断出来,而有些却有不可以,尤其是两个字的短词。 为什么呢? 我要怎么做?
O 这个错误我也出现过,是刚刚创建了项目没有写入数据的时候会出现 你先不理他,直接写入一部分数据,然后再检索,应该就没有这个错误了。
...ndex = self [lan] type = numeric index = self 另 1.$doc->from 取值也是乱,不是gbk或utf8的问题 2. setQuery($keyword) 里面的keyword不为空时,是不会出现乱码的
停止服务时是 searchd 非常慢还是 indexd 非常慢呢? 你的日志是发生卡死时的日志吗,indexd.log 里看到你更新并发有 20 个,为什么会这么多?可否进一步优化,但并没有异常。 搜索进程看不出有异样。 下次出错时我希望你可以 ...