这个是内置的一个复合分词功能。你要关闭这个功能可以在搜索时: $xs->search->setScwsMulti(0);
研究了一下源代码,最终功夫不负有心人,成功的避过了中英文混合,使用字典中的词语分词,我用的是 在调整每次读取数据的大小和缓冲区大小时有不同的情况
像蜘蛛爬虫那样去检索指定的网站,把数据存入数据库,然后搜索 [hr] 像 sphider 开源的那个,只不过他没有中文分词
...据是12345678 我搜索345却也不能出结果!为啥?? 默认的分词也不行,:huh::huh:我用csv导入的 中文全都不可以搜索和显示出来 [id] type = id [user] index = both tokenizer = full [q] index = both tokenizer = full [w] index = both tokenizer = full...
中国国民党荣誉主席连战及随访 结果分词就把“连战及”分到一起了。 请问有解决办法嘛? 似乎两个字的名字,容易和后面的字分到一起。 我在论坛中看到了“武松杀”的帖子,但是貌似没有解决办法? 谢谢。