你可以用 php -i | grep ini 就可以看到当前命令行所采用的 ini 文件的路径
...過 1gb 我有看到 gen_dict.c 但是是有有繁體utf8的 dict.txt 可以讓我自行編輯 麻煩 hightman 大大 [/quote] 这样的错误可能是运行的平台的字节序不一样或者.xdb文件已损坏所导致的. 我发一份我这边正确导出的词库吧.(你可以从附...
这是分词的策略问题,这种情况可以自定义分词器来补充。。。 将你的词复制到 [url]http://www.xunsearch.com/scws/demo/v4.php[/url] 进行实测,分割结果为: E14188m E14188 14188 14188m 那么搜索以上4个词都是可以搜索到的,至于你从中提取 e...
正如之前的帖子描述,scws_has_word这个函数可以用来检测非法词。当前我的项目中禁止词是放在数据库里面(为了方便增删改),如果每次加载词典都要把禁止词写到临时文件,然后添加,觉得有点过于麻烦。是否可以提供添加...
...索引,重启服务,但搜索结果依旧。 好像没有起作用。 可以到 http://www.heihedata.org/search/ 搜索试验[hr] 可以先搜索塔里木,然后再把模糊搜索打开,结果差别很大
... 它们都必须是独立的词汇,也就是最小的索引单位,不可以是多个词组成的短语。 > tip: 独立词汇的意思对于英文来说就是一个单词,对于中文来说必须是 `scws` 词库中的一个词。 > _Xunsearch_ 的同义词不同于 _Xapian_,会智能进...
这个自己编译下csws的扩展就可以了。他已经带了csws的。去csws的目录里编译下PHP的扩展就可以了。
xunsearch能否实现类似mysql like这种模糊搜索? 比如用户只搜索 xunsea 同样能搜索到含有 xunsearch 的内容,搜索的字段属于标题类型的,单条数据量不是很大 如果不可以有什么高效一点可以替代mysql like的方案吗?
... 导入索引支持数据源包括:`csv, json, mysql, sqlite` 等,也可以自定义数据源。 运行脚本工具的 --help 选项可查看内置的帮助和说明,如乱码可在选项后加入 -c gbk 试试。 ~~~ $prefix/sdk/php/util/Indexer.php --help ~~~ 主要参数和选项 ------...
加大,前门,缩小,从前 不过这个是词性关系,可以考虑增大 p(1) + n 的权重。 在 etc/rules.ini 和 etc/rules.utf8.ini 的 [attrs] 后方加入 p(1) + n = 5 即可 我们的DEMO已经更新,[url]http://www.xunsearch.com/scws/demo/v4.php[/url] 您也可以参见我们...