...ad_scws->d = main_scws->d; thread_scws_r = main_scws->r; 来共用它们,因为词典和规则集都是只读而且各API都是线程安全。
我想问一下,自定义的词典里,只有word,没有其它TF、IDF、Attr可以吗?能生成吗。 因为我试了直接加载TXT的太慢了,想转换成XDB。
我以前问过,不能单独更新特定字段的。只能全部更新,因为你ini文件里边都设置好了每个域的。 不过要是能只更新某个字段的话就非常好了,
...23606756'] 从打印结果看得很明显 addRange 没有效果。 这是因为 setQuery() 相当于清除所有查询条件,所以你必须把 addRange, setSort 放在 setQuery 之后 $search->setQuery($q)->setLimit(...)->addRange(...)->setSort(); [/quote] 3KS
清除符号本质上是根据词性来处理的。勾上词性后发现这些被清除的词性都是 un 所以会被清除,这是因为词典的数据不对导致的,之前的繁体词典是一位朋友帮忙整理的,可能有所缺漏和不对。
...出现的越高) IDF是逆词频率,也就是说这个词更重要(因为罕见一些);具体参见:http://baike.baidu.com/view/1228847.html 并没有很固定的算法,SCWS中的tf/idf均经过特殊加工处理了
是你自己搞错了! “是一”本身不是词,只是因为二元结合法所以scws自动将其合成为一个词。 复合分词是对原本是词的长词情况处理的,比如”中国“可以切成”中“+”国“+”中国“ 你的问题必须是 [code] $tk = $tokenizer->s...
...oo long(S#402) 我想问下关于讯搜的搜索语句过长的问题。 因为当搜索语句过长的时候会报错,用户体验很不好。 在哪里可以获取搜索语句的长度。或者当超过长度限制的时候在哪里可以判断。 有没有一种方法就是可以当长度...
8383是索引服务。 8384是搜索服务。 你的连不上应该是因为你的系统开了 SELinux 功能导致一些功能受限,你查查怎么设置啊 还有不要一直重复发主题,汗!