...说明吧. 我不清楚你用的是什么方式,是PHP还是c的API, set_dict 时的第二参数可以指定将词典读入内存的.
...r] [root@estar scws-1.1.5]# /usr/local/bin/scws -A -d "/usr/local/scws/etc/dict.xdb" "LG集团5.3%" LG/en 集团/n 5.3/en %/un +--[scws(scws-cli/1.1.5)]----------+ | TextLen: 10 | | Prepare: 0.0002 (sec) | | Segment: 0.0002 (sec) | +-----------------------------...
... 下面是我的测试。 [xxxxxx@www etc]$ scws -r rules.utf8.ini -d dict.utf8.xdb -c utf-8 -I 今天花了12万元啊 今 天花 了 万 元 啊 [xxxxx@www etc]$ scws -v scws (scws-cli/1.1.8: Simpled Chinese Words Segment - Command line usage) 版本1.1.8
txt词库其实也是转换成XDB再调用的,不用担心性能。 你合并词典很简单啊,把 dict.utf8.xdb 导出来嘛
...板/H/61/-/PLUS”。尝试过自定义词库,$prefix/data/项目名称/dict_user.txt 加入H61,但是不起作用,中文词汇是可以的。如果想分词结果中有H61,是不是只能自定义分词了?像这种商品的型号中很多类似的,如华硕主板H87-PLUS,H61、H87分...
... [/quote] 目前没有直接支持自定义词典,而是直接读取 dict.utf8.xdb 你自己改词也必须转换成这个词典文件才能用。 词典转换关于SCWS的网站上有。
...一下,用什么方法可以添加上述2个自定义词呢? 1、在dict_user.txt 里添加了自定义词,系统不能提取到上面2个词 2、在 /etc/rules.utf8.ini里添加专业的词,我在 [special] 下添加了上述2个词,结果还是没能提取到 麻烦了,在此先行...
...扩展目录了,也下载了以下三个文件放在D:/PHP/SCWS/里面 dict.utf8.xdb rules.ini rules.utf8.ini rules_cht.utf8.ini 然后在php里也由设置了 [scws] extension=php_scws.dll scws.default.charset=utf8 scws.default.fpath="D:/PHP/scws" 但是在phpinfo()里找不到scws的...
...回應的是自己在合併過程中,碰到的情況。 在個別將 dict_chs(t).utf8.xdb 導出,倒入資料庫處理時發現,有重複的字詞,這部份不多: chs 部份 : 禎, 银朱, 集科, 负电, 那霸, 无名肿毒, 燏, 无业, 安徽日报, 威兴我荣, 医疗器械...
...说明吧. 我不清楚你用的是什么方式,是PHP还是c的API, set_dict 时的第二参数可以指定将词典读入内存的. [/quote] 安装了apache扩展,使用PHP进行调用,也可以设置读入内存? 如果可以的话,每次分词还要设置词典么?