搜索出来的结果,会根据匹配的结果,省略前面或后面的字符串,都用了“...”代替。。但是我的项目中,需要把这个字段的值全部展示出来。 请问一下怎么实现?多谢!:D
如果你了解scws就会知道它其实对散字也是自动二元处理。 你所谓的一元是一个字一个词?你也可以拓展 XSTokenizer 自己实现分词
看了一下基本上说内置了中文分词 内置中文分词 好处我想应该索引会相对的小一些 但是坏处就是要维护词库 新出词语不用立马根据 所以问一下是否支持一元分词 这样就可以实现类似mysql like方式的搜索了
配置文件设置了时间戳这个字段是numeric类型,想实现搜索的结果进行倒序排列,也就是说新发布的信息都排在最上边,用了setSort、setMultiSort都没起作用,请问是怎么回事呢?
Xapian 里对 facets 的功能实现其实并不是很优雅,效率也一般,相当于增加 matchspy ... 如果是为了分组统计建议直接生成要关词条再用 count() 做估算。
[quote='hightman' pid='3961' dateline='1294120955'] 这个其实可以通过现有的 libscws 实现的,不过 phpext 里还没有提供。。。 [/quote] 这个是个蛮实在的功能,可以快速形成一个自定义的词库,如果可以,建议phpext提供
我试了下目前的多粒度分词,有一种情况不能实现 比如词典里有: 我们是中国人 我们是中国 我们是 中国人 中国 当要分句子: 我们是中国人 无论怎么设置,都无法分出 我们是中国 我们是 这些词 就是目前是...