可以的啊,用SCWS_XDB工具导出成TXT格式就可以编辑了. 但要注意词性最多2个字符,不可以是#和@和!,这三个有特殊函义
谢谢回复。 另外scws结构体中:unsigned char *mblen; unsigned int mode;这两个成员也应该是可以多个线程共用的。
是1.5你手动改一下吧 或者 patch -p0 libscws/scws.c < scws.patch 你的命令行我没用过不知对不,用上面这句应该肯定可以
不太了解这个规则集的写法,请高手给讲解一下,谢谢 比如这个 [areaname2] :type = suffix :znum = 2 :exclude = noname,symbol,alpha,chnum2 :tf = 4.5 :idf = 3.0 :attr = ns :line = yes 东路 西路 支路 街道 南路 北路 分别是指什么意思呢?
这个是内置的一个复合分词功能。你要关闭这个功能可以在搜索时: $xs->search->setScwsMulti(0);