我在使用scws时遇到以下需求: 原来文本: 转让二手徐工汽车吊,二手16吨吊车,二手25吨吊车 15千克压力机 使用scws分词后: 转让 二手 徐工 汽车吊 , 二手 16 吨 吊车 , 二手 25 吨 吊车 15 千克 压力机 分词非常准确,...
可能是你的词被切成了其它不合理的单位吧. 加到special没有用. 你最好测试一下被检索的语句/文本切词后的效果...
...到了楼主原先的一个回复: 建议把这些要过滤的词新增加文本词典,属性设为 ! 即可。或者自己根据词性直接在取得返回值的时候排除它。。 尝试了下,是可以的!!!多谢
文本词典格式,文档多处有提到吧 每行记录包含以下字段 \t\t\t 工具 用法可以 ./gen-scws-dict -h 查看
我打开文本文件,看到格式是: 新闻 14.89 3.91 n 新浪 14.89 6.26 nz 文学 14.89 3.91 n 小说 14.89 3.91 n 在线 14.89 3.91 vn 博客 14.89 3.91 n 公司 14.89 3.91 n 免费 14.89 3.91 vd 信息 1...
...() 魔术方法 __set XSDocument addIndex() 给字段增加索引文本 (仅限索引文档) XSDocument addTerm() 给字段增加索引词 (仅限索引文档) XSDocument afterSubmit() 重写接口, 在文档成功提交到索引服务器后调用 XSDocument beforeSub...
[quote='hightman' pid='6577' dateline='1309234009'] 文本词典格式,文档多处有提到吧 每行记录包含以下字段 \t\t\t 工具 用法可以 ./gen-scws-dict -h 查看 [/quote] -h 看过.. 不太明白命令规则..
...get('scws.default.fpath') . '/a.txt' , SCWS_XDICT_TXT);(注:a.txt)为文本字典,运行无报错,但是无法正确匹配(如:我的a字典就2个词,好纠结啊,纠结死啦,但是当我输入时还是分词为 纠结|死了),求救啊!! 还有帖子1中,字典的问...
...有的字典不太适合我们做地址的分词,能不能给个办法将文本的转为dict.xdb格式,看到你在论坛中回复提到一个转换程序,但我不知道在哪里下载。 先谢谢你。[hr] 我们系统对速度要求不高,关键是分词效果,没有字典很难办。