事实上,我UTF-8的一直不成功,GBK的就会出现那样奇怪的问题 今天我又再试了一下(GBK版本的),在Windows下,在文件保存的时候,选择编码“ANSI”,这样就不会出现那样奇怪的问题了
比如说“这本书”,在用C语言编译调用scws分词结果为"这/本书",但是编译为php扩展后调用,结果为"这本书",没有分掉,同一份代码同一个词库同一个规则集,为什么会出现不一样的结果?
...ING | XS | 用于缓存项目配置文件的解析结果 | 共计 8 项通过,1 项警告,0 项错误。 配置文件如下 project.name = test project.default_charset = utf-8 server.index = 10.1.20.51:8383 server.search = 10.1.20.51:8384 [id] type = id ...
不明白你说的具体什么意思。 addWeight 的权重可以是小数,注意微调。这个加的不是字段而是针对包含指定索引词的文档提权。