比如我要搜a4纸,但是实际上我的意思是要出a4复印纸,问题是基词的分割是a4与纸,指定同义词的时候就会无效,谁有更好的解决方案? 我的方案是过滤这个关键字,用setQuery的or语法查出来
[quote='KnightE' pid='334' dateline='1323542477'] 应该尽量通过xs得到id,然后根据id批量从DB/NOSQL取信息,直接从xs取信息不是个好主意。 [/quote] 取信息可以从DB/NOSQL取信息,但是涉及到从XS过滤 就是个问题了
...!!![hr] 我找到了楼主原先的一个回复: 建议把这些要过滤的词新增加文本词典,属性设为 ! 即可。或者自己根据词性直接在取得返回值的时候排除它。。 尝试了下,是可以的!!!多谢
... 1.0.0 源代码 sdk/php/util/XSDataSource.class.php 内置调试过滤器, 直接打印数据内容 Public 方法 隐去继承来的方法 名称描述定义于 process() XSDebugFilter processDoc() XSDebugFilter 方法明细 process() 方法 ...
...标点、中文标点、中文等文字要素(可阅读部分,HTML已过滤),视情况而定,搜索引擎还有可能抓出含有乱码的片段。 但是SCWS分词时似乎要求字符串中只能有中文和中文标点,否则就会分词失败。 请问这个是我对SCWS的使用...
...,TF主要用于词的切分,IDF用于统计,词性就用在取TOP时过滤或标注上。 最好是基于现有的词典去补充,你重建一个的话数据又都没有效果可能会比较差。SCWS主页上有一个TF/IDF计算器,你可以参看一下效果。 http://www.ftphp.com/...
... /usr/local/xunsearch/sdk/php/util/XSDataSource.class.php on line 332 过滤器 debug 不显示 json导入出错