...单调整一下规则集来获得比较好的效果。 查到原因了,是因为词库里居然有个错误的词叫“民医院”!! 建议删除该词重新生成词典或,写一个附加词典标记为删除。内容如下,保存为名字 del.txt,然后在分词前加入一句 $scws-...
...词要达到符合语法的最长.这个难度估计不小,呵呵,也可能是比较不现实的需求. 自己架设scws分词库程序当然可以导入自己的词库,但是不是每个人都愿意这么做.在线api还是很有优势的.
问题解决了~ 原因是autoconf的版本低于scws原编译的版本了 详见 http://dev.firnow.com/course/3_program/c++/cppxl/20090508/166831.html 到http://ftp.gnu.org/gnu/autoconf/上下了一个最新的包安装了一下就OK了~
... , SCWS_XDICT_TXT);(注:a.txt)为文本字典,运行无报错,但是无法正确匹配(如:我的a字典就2个词,好纠结啊,纠结死啦,但是当我输入时还是分词为 纠结|死了),求救啊!! 还有帖子1中,字典的问题,生成的字典是因为无法...
...arset = 'UTF-8'; } return $this;} 设置字符集 默认字符集是 UTF-8, 如果您提交的搜索语句和预期得到的搜索结果为其它字符集, 请先设置
...内有那个“词”。 比如:陈百强-不.mp3 这样分词的结果是 [color=red]陈百强 陈百 百强 不[/color] 这样搜索”不“,搜索”陈百强“,”陈百“,”百强“都可以搜索到,怎么会不能搜索单字呢,当然如果你非要搜索”百“字也要...
[quote='hightman' pid='3707' dateline='1364206364'] 这错误有点奇怪啊,说找不到函数库的样子。你是什么操作系统啊 [/quote] redhat 4.0版本的系统啊,那应该怎么办啊,hightman 老大
MACOS比较 麻烦,因为正文UTF-8,目录是GBK,所以无法协同,我在MACOS用ICHM看好多文件时也出现过这个问题 。 下次把文件 统一用GBK编码可能 可以解决
我的也无法加载,php版本为5.3. 估计不是路径问题,是php版本问题。感觉现在服务器系统用windows的很多。建议也重视23版的开发和升级,比如加入get_tops等
我说您写错的实例是说的,您添加自定义词库那里,您多写了一个t,[hr] 您说的我都检查了,没有错,但是就是分词不对,我下的都是您最新版本的,您自己看看是不是词库提供错了呢?分词真的不对。