...一个建议,BBS中很多 \x1b (即 ascii=27 ESC键)的控制符,应该在建索引时给预过滤可能更好。 \033[1;31;44m 这样的格式,用正则过滤掉就好了。此外,我看到了你默认搜索的是 2年内,所以可能效果上采用了 value compare (addRange)的所以...
...,以下我写出来作参考,把下面的文字存成dict.txt,然后在原有的set_dict之后加上 scws_add_dict(s, 'path/to/this_ad_dict.txt', SCWS_XDICT_TXT); 这样使文本词典生效. 其中词典格式为 词 tf idf attr (当attr为!表示删除该词) [code] 市廛 1 1 ! 河华 1 ...
1:我要做同义词搜索 文档我找了N久 不知道在哪里开启 看了开发文档 说是设置setAutoSynonyms(true)就开启 但是我测试部行啊 附上代码: [php] $xs = new XS('demo'); // 建立 XS 对象,项目名称为:demo $search=$xs->search; $search->setAutoSynonyms(tru...
...search->setCharset('gbk'); 无效,输出来的还是uft-8;求助我错在那里? require '/usr/local/xunsearch/sdk/php/lib/XS.php'; $xs = new XS('allsource'); // 建立 XS 对象,项目名称为:demo $search = $xs->search; // 获取 搜索对象 $query = '部分'; // 这里的搜...
..._get_tops($sh, 5); 另:我使用工具把默认的.xdb转化成.txt后在使用scws_get_tops()方法(字母+数据要大于8个才返回)。 我的邮箱lee1984@qq.com 新手!求帮助啊
小弟新手。就是想问一下。在服务器上安装的时候,是不是要安装到项目可以访问到的目录下? 比如我项目是在aaa目录下 ,我把xunsearch 安装到bbb目录下,这样是不行的对吧?? 求解。。。
为什么我对一串utf-8编码的中文分词,竟得到了下面的效果(只是单纯得到每个字) 我在程序里已经设置了编码方式 scws_set_charset(s, "utf-8"); [attach]124[/attach]
...。 搜索结果界面还可以让专业美工再美化一下^-^ 我自己在大学时很多时间也泡在 telnet bbs上呢,对这类BBS的感情很特殊,很多电脑技术也是在此基础上学习起来的。 我的论坛也开着,是 MapleBBS 的修改版 [url]telnet://bbs.twomice.net[...