...不到新add的数据 文档上写的返回的index对象,不知道能不能调试啊[hr] 按大大指示,加上了 $index->flush(); 还是没效果,这个add方法有返回提示吗,API上的 {return} XSIndex 返回自身对象以支持串接操作 没看太懂。。[hr] http://icms...
...的問題。 不過我數字可以,但是[color=#0000CD]英文[/color]不能。 我是使用[color=#FF0000]繁體字庫[/color]。 版本是:php_scws.dll(2)/Windows/PHP 5.2.x [php] [/php] 結果在下面: [code] 原始文字:這個文件是為了測試英文:Jam...
这个不能随便改,但可以通过调整源码的编译参数来改。通常不需要这么做啊,实在有必要时你们可以考虑继承XSTokenizerScws 来自己修改它。
我看了一下scws_set_multi,似乎不能解决我得问题。我再描述一下,打个比方,我要切分一段有200个汉字的字符串,但是返回的分词数组只包含了前100个汉字的词。[hr] 我还是把代码贴出来吧。 从返回的分词数组可以看出来...
...hightman' pid='4093' dateline='1299644984'] 导出的TXT格式的顺序并不能说明什么。。。。 [/quote] 那么会在什么环节出了问题呢? 为什么官方的比自己打包的快很多? 非常想知道答案 效率第一 = = 是不是要用 gen_dict.c 创建XDB比较好 ...
...不同权重设置,而对于一些无分类的内容使用较低权重(不能直接过滤,我希望没分类的内容能搜索到,只是希望排序靠后)。 demo中的案例使用没有问题,在实际开发中,发现没有起作用,估计是配置差别导致。经过反复对比...
...2011-11-08还是2011-11-07都能搜到这条航线[hr] 其实我是想能不能把几个日期组合成“2011-11-07分隔符2011-11-08”这种格式,然后存到同一个字段里面,那这样子在搜索的时候无论搜“2011-11-07”和“2011-11-08”都能搜到这条记录
...好,用自定义词库是可以解决但却不是太方便,如果SCWS不能这样的配置,我还是用程序实现顺。因为用自定义词库,我得把所有的钱其它的都写进去,如 10秒 11秒 ..... 10元 11元 像这些是不固定的哈 原先我还以为rule.ini可以...
[quote='hightman' pid='3251' dateline='1359526251'] 这个不能随便改,但可以通过调整源码的编译参数来改。通常不需要这么做啊,实在有必要时你们可以考虑继承XSTokenizerScws 来自己修改它。 [/quote] 感谢,我就是这么干的~
不能正确分词,测试代码在 Windows php5 下运行正常 纠结问题所在 原话:“喜讯:谷歌中国宣布将关闭两大服务 终止与天涯合作” 分词结果:“谷歌中 宣布 关闭两” Windows 下分词就是正确的 分词结果:“喜讯 谷歌 中国 宣布 ...