...同法” -“浙江” 都无效?后者还是会出来带省和浙江的内容。 而词典里 浙江省 ,浙江,省 这几个词条都是存在的, 有没有什么办法让+“合同法” -“省” ,+“合同法” -“市” ,+“合同法” -“县”, 都有效呢
请问如何使用scws来自动从一篇文章内容里面提取Tag标签,仿很多博客系统里那种功能,应该怎么实现,本人小菜鸟,希望大家给点指引,谢谢。
我把从XDB词典文件中下载的GBK格式的词典,放在PSCWS23程序的词典文件中作为默认词典,然后我运行PSCWS23程序的demo文件输入内容后检测结果匹配不到。这是什么原因??:huh: 望各位高手不吝赐教,谢谢
恩,我也出现这样的问题,我编码是GBK,加载txt自定义字典后无法取得字典中的内容。 你这种写法txt会把上面的xdb覆盖掉的。 可以使用add_dict增加xdb字典的后面并优先。
...多个子索引库,怎么样能拿到每个子索引库,转换出来的内容呢[hr] $xs->search->setDb('products'); $words3 = $xs->search->getExpandedQuery($searchText); print_r($words3); //这样也不行
谢谢 hightman 这个接口是read log_db中的内容吧。一个项目会有一个log_db。 如果按照项目来,那样会不会有什么不好的地方呢?
...硬盘.. 我的数据大概在50W条左右,data目录只有不到500M的内容...但是每次搜索都需要40s(真的是40s)的时间才能返回数据 主机是在阿里云上面的,确实磁盘性能很差.. 有什么办法能把数据大量的同步到内存的吗?
...=mixed时,split分词器就不会执行 这是怎么回事? 这是我字段内容 1=2&3=1&4=3-------------- 这是字段配置 [userinfo] tokenizer = split(&) type = string index = mixed 搜索1=2 分词器不执行,搜索userinfo:1=2 分词器才会执行 这是怎么回事?