呃确实存在,这都跟这个词库有关系,是互联网上整理的词库,像“法上”居然是专有名词而且权重很高。。。 可以考虑删除“法上”这个错误的词,外挂一个文本词典把“法上”标记为删除或设成更低权重及词性
...那么每个服务端独自使用自己的自定义词典文件。 添加删除修改自定义词库只要编辑该文件即可,以下为相关规范: - 文件为纯文本文件,编码必须是 UTF-8,可用任何编辑器修改 - 每行一条记录表示一个词,每行包含 1~4 个...
...是新增词 2.0 再试一个 1.0 1.0 @ ; 以下词为删除项 删除 1.0 1.0 ! scws -d /usr/local/scws/dict_extra.txt -c utf-8 我是新增词 我 是 新 增 词 再试一个 再试一个
... 存于系统临时目录),故建议TXT词库不要过大! 5) [b]删除词作法[/b],请将词性设为“!“,则表示该词设为无效,即使在其它核心库中存在该词也视为无效。 2. [libscws] 新增 int scws_has_word(const char *xattr); 和 scws_top_t scws_get_wo...
... 存于系统临时目录),故建议TXT词库不要过大! 5) [b]删除词作法[/b],请将词性设为“!“,则表示该词设为无效,即使在其它核心库中存在该词也视为无效。 2. [libscws] 新增 int scws_has_word(const char *xattr); 和 scws_top_t scws_get_wo...
...是因为词库里居然有个错误的词叫“民医院”!! 建议删除该词重新生成词典或,写一个附加词典标记为删除。内容如下,保存为名字 del.txt,然后在分词前加入一句 $scws->add_dict('/path/to/del.txt', SCWS_XDICT_TXT); 如果您不会制作词...
...可以通过 [XSIndex::addSynonym] 和 [XSIndex::delSynonym] 来添加和删除同义词记录。 多次调用这两个接口函数的时候支持使用[索引缓冲区](index.buffer)来提高效率。 参数 `$raw` 是字符串,表示记录中的原词(标准词),`$synonym` 也是字符串...
...做更有利于全文检索。 [b]scws-1.1.7 发布于 2011-05-21[/b] 1) 删除 __PARSE_XATTR__ 宏中企图修改 xattr 的内容的作法, 当 xattr 为常量字符串时会出错. 2) 调整 config.h 的包含方式移入 .c 文件而非 .h 文件 3) 增加一些PHP测试脚本, 位于phpext...
...于词库太大干扰所致,建议可以附加一个小词典(目的是删除这些无用词汇,以下我写出来作参考,把下面的文字存成dict.txt,然后在原有的set_dict之后加上 scws_add_dict(s, 'path/to/this_ad_dict.txt', SCWS_XDICT_TXT); 这样使文本词典生效. 其...