问题是,我在现存的词上创建同义词,也不是无效的!!!不得不采用index search 的or 语法
不明白你说的。同义词是基于分词后的结果制作的。 如果你的索引先前制作,后面再添加自定义词,那么当然无效了。你要重建索引
你可以正常分词试试,然后打印一下词的 attr 属性到底是不是* 号 我估计是不是你自定义词典先于默认词典加载,导致attr属性被覆盖了?
已经在使用1.1.7,非常感谢,这扩展在标题中取自定义的标签帮了大忙。
下了最新的1.1.3,但是我在windows下winrar解开,里面空的,这个压缩包是不是有问题啊?1.1.2是正常的。呢个对应的ut8的压缩包也不对
我在oschina.net上大吹老兄的产品 结果被乱K,哈哈
问题1:使用原生的词库对‘阿斯顿发斯蒂芬罗铭罗大大罗’这段话进行分词 其中结果为: 阿斯顿 阿斯 斯顿 阿 斯 顿 发 斯蒂芬 斯蒂 蒂芬 斯 蒂 芬 [b]罗铭罗 罗铭 铭罗[/b] 罗 铭 罗 大大 大 大 罗 [复合分词选项] 最短词 二...
嗯。词库我看到了,我是想在这个基础上做加入一些新的自己的就可以,您的这个支持,动态词库吗? 还有请问哪里能下载到,你的词库原文件。没编译过的。[hr] 我看到scws的代码都集成到xapian的queryparser中了,我想直接加入新...
写了一行脚本,将代码转为 UTF-8 编码的源文件: #!/bin/bash for i in `find ./ -type f |grep -v 'batch' ` ; do iconv $i -f gbk -t utf8 -o ${i}.tmp && mv ${i}.tmp $i ; done