[quote='hightman' pid='251' dateline='1322149925'] 不是很明白,你说的自动分词??是什么意思 你在配置文件中不要指定 tokenizer 选项就会自动使用 SCWS 分词了。 [/quote] 嗯,可能描述不清。 我就是想有一段文字,然后根据这段文...
[quote='hightman' pid='255' dateline='1322196172'] 还是不明白! 你把这段文字用scws切割会有问题吗?如果你这段字是用空格或逗号分隔,那么你可以用 split 这个分词器啊。 搜索的时候搜索任何一个分割后的TAG都可以搜索到。 [/quote] ...
讯搜怎么连接数据库的,直接用文档的方法查不到数据啊,打印的是空数据啊,数据库里面有这个关键词的 $xs = new XS('question'); $search = $xs->search; $index = $xs->index; $query = '健身'; // 这里的搜索语句很简单,就一...
嗯。词库我看到了,我是想在这个基础上做加入一些新的自己的就可以,您的这个支持,动态词库吗? 还有请问哪里能下载到,你的词库原文件。没编译过的。[hr] 我看到scws的代码都集成到xapian的queryparser中了,我想直接加入新...
...这是因为程序里并没有判断武松已经是一个词了,而当它看到武这个字时,于是看到这是个前缀,而在武这个字后面至多可以跟着两个字,所以将杀也一起加进去了。而后面的词性语法规则对这句里的词性无法起作用,最终就将...
...车 贴” 我该如何操作,才能使得这个词不被分开 我看到有用户自定义词典 dict_user.txt 我在里面写了: 米兔车贴 1.0 1.0 ! 但还是被分了 还看到一个stopwords.txt的文件,但将米兔车贴放到里面了也还是会被分 。。。
版主您好,我是来自台湾的研究生,看到您开发在PHP上的SCWS,着实让我感到非常地钦佩。 我安装了SCWS-1.1.2的PHP扩展,并使用「清除标点符号」来进行断词时,发现连非标点符号的字都被省略掉了。 在线演示的网页中也有...
...去掉 home=$prefix/data/$1 2 提高索引更新速度 xs-indexd -h 看到 -q这个参数 默认是3000 也就是说 当提交了3000个文档处理要求的时候 才处理 可以将xs-ctl.sh 75行的 加-q 200 这个200看你的服务器性能情况和要求 3 提高搜索子进程 xs-s...
你看到错误提示了吗?有没有试着自己理解一下错误提示内容? 意思是服务端连不上,你开启了没有?bin/xs-ctl.sh start
May 2 11:59:50 host earchd: worker[3]: *** glibc detected *** xs-searchd: worker[3]: munmap_chunk(): invalid pointer: 0x084faab0 *** 就看到这一个。 我是强制结束进程后启动的!