...您的索引数据库相当大,希望对索引库进行适当的分割,可以自命名新的索引库。 在搜索时可以使用 [XSSearch::addDb] 进行多库并行搜索。 ~~~ [php] // 比如把当前索引更新到名称为 db2 的库中 $index->setDb('db2'); // 在检索时同时搜索 d...
...调用 add_dict 加入词典 [/quote] 您好,用自定义词库是可以解决但却不是太方便,如果SCWS不能这样的配置,我还是用程序实现顺。因为用自定义词库,我得把所有的钱其它的都写进去,如 10秒 11秒 ..... 10元 11元 像这些是...
建议支持词库里的词可以是纯英文单词,虽然在分词时英文单词可以自动识别切分开,但在关键词提取和非法词过滤时却无法提取出或过滤掉纯英文单词。 比如:我要从一些商品名中提取一些品牌:adidas nike。。。对商品名分词...
xunsearch 搭配工作的不是标准的 xapian-core,而是打过 scws 补丁的 xapian-core-scws。压缩包可以从发布的 xunsearch-full 中获得。 你也可以下载标准的 xapian-core 包,然后将源码里的 xapian-scws/path.xapian-core-scws 补丁打进去
欢迎使用SCWS,有什么问题或建议都可以记录在这。 对于检索部分,光有分词还是远远不够的,而且现在的全文检索已经不仅仅只是匹配、返回这么简单了,用户体验要求也高起来了。 布尔搜索、关键词联想、拼写纠错、拼...
...的 又不想修改XS.php(对以后升级不方便)如果下一版本可以控制就好了 最好默认不要自动添加 或者可以另外控制不需添加。 [php]if(strpos($_SERVER['REQUEST_URI'],'xunsearch.com')) $XSSearch->addSearchLog();[/php]
[quote='hightman' pid='3251' dateline='1359526251'] 这个不能随便改,但可以通过调整源码的编译参数来改。通常不需要这么做啊,实在有必要时你们可以考虑继承XSTokenizerScws 来自己修改它。 [/quote] 感谢,我就是这么干的~
...h采用 scws 分词 xunsearch好像集成了 scws 对于分词 xunsearch 可以通过 XSTokenizer 扩展 我想问的是 既然是 集成scws 那么 1.有没有提供scws的api接口,实现短语分词功能 2.是否可以对scws自定义中文词典,方便扩展 [/quote] 目前没有直...
...器。 这样无论是通过管理工具,还是通过sdk 导入数据都可以默认掉用这个过滤器。 这样更便于整个项目的管理。 以后如果我想修改过滤规则,紧紧只需要修改一个文件就可以了
词库的字节序原因,你可以在 ppc 处理器上重新用 bin/gen-scws-dict 制作一份词库就可以了。