成功了,不用重新编译php,只要编译后获得scws.so即可,然后在php.ini里面写上正确的路径[z=maozedong]搞定啦[/z]
多谢汇报,根据词典机械分词存在一定的误分率。 因为该词典从互联网信息为主要语料进行取值,故可能存在一些错误,只要将词典中的 年高 词频调低即可。 若不方便改词典可以加一个文本词典,并将 年高 词频减低。
只是警告不影响 使用,缓存模块会对配置 文件 进行缓存提升效率,但这是可选的。 只要您的PHP开启了 apc/xcache/eaccelerator 其中任何一个扩展 均可以。
[quote='bigxu' pid='920' dateline='1339722807'] 只要导入xunsearch数据库,所有搜索都支持 [/quote] 具体代码能share一下么?
...拉伯数字的节日 如”51劳动节“ 只能分出”劳动节“,只要数字在前面就识别不出来,同时也很奇怪如果这些数字大于百位数 如”2014劳动节“ 就能分出2014和劳动节,最终想要”61儿童节“=61+儿童节 的效果,大神求助。。。
一个项目支持255个字段,你可以考虑合并为同一套字段方案,只要一个INI。 若实在需要分库,想办法合并结果吧。。。
...自己再简单加个判断?现在新版 1.3.1 提供了 scws 接口,只要把这些黑词加到自定义词典,并取一个独特的词性,那么就可以用 XSTokenizerScws::hasWord() 的功能来判断是否包含黑词?
不需要任何修改就直接支持英文呀,只要你的数据英文的就可以了。 支持词根功能,即搜索 “stories”和搜索 story 可以视为一样