...default.fpath") . '/dict.utf8.xdb'); $so->add_dict("/usr/myapp/dict_extra.txt",SCWS_XDICT_TXT); $so->set_rule(ini_get('scws.default.fpath') . '/rules.utf8.ini'); // $so->set_duality(0); $so->set_ignore(0); $so->set_multi(0); 就是不行. 我也怀疑是词库加不上的问题.这个问...
dict_user.txt 里写是对的,词性不要用叹号,随便写个别的吧。叹号表示删除此词,不分就要让它成为词啊。
按“说明”里的方法 ,我在CMD里做了如下输入 ,能运行,但是导不出内容来: 怎么回事呢?能正常运行分词的功能。 F:\phpStudy\PHP5> php F:\www\test\pscws23\XDB-IO\dump_xdb_file.php F:\www\test\pscws23\XDB-IO\dictxdb C:\xx.txt 请教HM,谢谢!
...php demo word util/Logger.php demo word --limit 5 # 把日志文件 words.txt 导入 dmeo 项目中 util/Logger.php --import=words.txt demo # 清空 demo 项目中 全部搜索日志索引,通常在重建搜索项目或日志数据过于混乱时才需调用 util/Logger.php --clean demo ~~~ ...
txt 自定义字典 起第哦 武则天 我就是 精武英雄 1.5 1.5 xx 然后 前端搜索 精武英雄 很正常 词属性是 xx 但是,当我修改了字典 然后上传服务器,然后再搜索刷新, 属性就不会改变了还是 xx 似乎有缓存。 而且似...
目前不行。只能自己生成 scws 的词典并放进 $prefix/etc/dict.utf8.xdb 覆盖 词典可以自己先制作TXT格式在利用SCWs提供的工具转换成XDB格式 [url]http://www.hightman.cn/bbs/showthread.php?tid=712[/url] 这个贴子后面有讲到
...。。。 [/quote] 谢谢管理员,俺想问下,如果在dict_user.txt里加了词汇,是不是要把索引全部重新建立一遍? 如果这个自定义分词是需要不定期的更新的话,有什么好办法没?难道每次都要重新建立索引吗?
需要指定词典位置,比如: # scws -A -d /hp/opt/scws/dict/default.utf8.xdb:/home/vanni/scws/mydict.txt -c utf8 "相宜本草洗面奶和雅漾舒护活泉水哪个好" 相宜/a 本草/nz 洗面奶/nz 和/c 雅漾/@ 舒护/@ 活泉水/@ 哪个/r 好/a