dict_user.txt 里写是对的,词性不要用叹号,随便写个别的吧。叹号表示删除此词,不分就要让它成为词啊。
一个不懂分词的小白~ 想问下 我用迅搜 如何设定一些词 使得这些词不被scws进行分词 比如 “米兔车贴” 这个词, 被分词成 “米兔车 贴” 我该如何操作,才能使得这个词不被分开 我看到有用户自定义词典 dict_user.txt 我在...
longhtml感觉挺强的。你知道这套系统的分布式索引怎么建立吗?翻来翻去翻不到,版主貌似藏起来有一段时间了。
用了最新版也不行. 如"冰毒"scws_has_word判断不出来 , 真奇怪 还有什么问题导致的呢?
直接修改代码 sdk\php\util\XSDataSource.class.php 482行 $host .= (isset($param['port']) && $param['port'] != 3306) ? ':' . $param['port'] : '[b]:3399[/b]';
是判断指定词性 我自定义词库格式如下: 销售什么 1.0 1.0 * 出售什么 1.0 1.0 * 出售各式 1.0 1.0 * 某词 1.0 1.0 * scws_t s=scws_new(); 用下面这个函数可以分出“某词”, scws_get_tops(s,1000,N...