想做自定义词库的功能。 哪位大侠,是否可以告知, http://www.xunsearch.com/scws/demo/get_tfidf.php 的算法。 谢谢
看官网说明,基本可以得知,支持简体中文 但其它支持哪些并没有明说,在特色与优势一页也未说明 我想知道对拉丁文和繁体中文支持吗?
你这样搞太麻烦了 宁可在索引时:$doc->addTerm('downLevel', '1', ord($downLevel) - ord('a') + 1); 然后在搜索时 $search->addWeight('downLevel', '1'); 就可以了。
解决了,我把插件里带的libtool(2.2.26),地换成系统中的1.5.22版的libtool就可以make可,不过暂时还不知道会不会有其他问题。
非常不错,可以继续琢磨一下如何优化。第二次搜索同一关键词缓存起作用后速度应该能明显变快 此外似乎没有开启拼音相关的功能,个人认为拼音相关的纠错功能还是很实用的
如果你了解scws就会知道它其实对散字也是自动二元处理。 你所谓的一元是一个字一个词?你也可以拓展 XSTokenizer 自己实现分词