...因为通常用户不能很好的自我归类。 我想XUNSEARCH是否可以实现, 文章发过来的,自动分词的基础上,得出最适合本文的标签。 这里可以按照权重来给标签来个排序,如:热门度,关联度,重复度等等。 如果xunsearch能出...
...不错。但我要说明的的: 1.命令行默认是UTF-8输出,乱码可以试试加上 -c gbk 2.过滤器用法是这样的你可以自命名一个过滤器,而不是去修改系统的过滤器,比如你在 /usr/local/xunsearch/sdk/php/lib/ 创建文件 XSTestFilter.php,然后按...
还是不明白! 你把这段文字用scws切割会有问题吗?如果你这段字是用空格或逗号分隔,那么你可以用 split 这个分词器啊。 搜索的时候搜索任何一个分割后的TAG都可以搜索到。
...器。 这样无论是通过管理工具,还是通过sdk 导入数据都可以默认掉用这个过滤器。 这样更便于整个项目的管理。 以后如果我想修改过滤规则,紧紧只需要修改一个文件就可以了
...字段里,用空格分开,检索的时候, 用mysql的全文检索,可以检索到结果, 然后在再程序里面对结果进行分析。 就比如说这样的sql语句是完全可以检索到的。 SELECT * FROM table_name WHERE MATCH(field_name) AGAINST('测试') 不知道这样...
...器。 这样无论是通过管理工具,还是通过sdk 导入数据都可以默认掉用这个过滤器。 这样更便于整个项目的管理。 以后如果我想修改过滤规则,紧紧只需要修改一个文件就可以了
...用restart,出现indexd stop failed现象 3.使用faststop,再start,可以运行起来 4.使用fastrestart,可以运行起来 系统:centos5.6(64bit)+php5.3.8
...- Notice: src/ 下的 cmd.c 必须先编译 libscws/ 生成 libscws.a 才可以。 phpexe/ 下的 libscws 直接连接 ../libscws 安全起见请先在 libscws/ 执行 make clean[/quote] 现在还没搞明白,能有个详细的操作指引么? 我的环境是windows,php5 我不懂c...
...line='1280312360'] 正如之前的帖子描述,scws_has_word这个函数可以用来检测非法词。当前我的项目中禁止词是放在数据库里面(为了方便增删改),如果每次加载词典都要把禁止词写到临时文件,然后添加,觉得有点过于麻烦。是否...
...ules.ini 是一个规则,比如像姓名或路名或章节数字之类,可以规定某些字凑在一起就视为整体,可以规定某些字开头或某些字结尾的N个字组成词组,基本上就是这样子。 比如姓名识别:列出了常用的姓,然后判断后面跟上1,2...