通常英文是不需要分词的,但很多时候词性是需要的,比如nike,dior这类品牌英文。 目前默认词性都是en,有什么办法可否自定义词典来改变他的词性。 还有个问题,就是纯数字的词性为什么是en呢,不是m? 望赐教。
抱歉,很久没有顾及 xunsearch。 刚刚升级到 xapian-1.2.19,scws-1.2.3-dev 最新版本,如果使用中发现有异常的,可以尝试升级到这个最新版本。 下载地址:[url]http://www.xunsearch.com/download/xunsearch-full-dev.tar.bz2[/url]
[quote='hightman' pid='3473' dateline='1361873508'] 自己规划就行了,xapian库支持远程的 [/quote] 你好,怎么支持远程呢,有相关资料吗
刚看到这个分词系统, 很感兴趣, 但是还不太会用, hightman能不能给个比较规范的步骤, 介绍一下怎样在c代码里调用scws的分词功能? 多谢