...算法,由于个人水平还有限,很多地方都不理解,问下你使用的分词方法是基于词典的哪种?能不能给我阐述下,技术的思想呢? 我的要求比较强求,毕竟是设计您软件的核心内容。我不是抱着去盈利或者其他什么理由来学这...
你好,感谢你的回复 以前使用sdk/util中的index.php重建索引是没有出现错误的,但随着数据库数据越来越多,就出现了这个错误,怀疑可能是连接超时导致的,就把180行这里原有的timeout设置成1000,错误依旧存在,昨天在论坛看了...
我使用scws的C版本提供的接口对省份、地市信息进行分词,发现分词的结果有时不是希望达到的结果。例如: 1 洛阳市廛河华林水席村 希望的结果为:洛阳市 廛 河 华林 水 席 村(词典中有洛阳市,市廛,河华,华林) 实...
确认问题是出在包含xs.php那段代码里。 使用自动生成的搜索骨架代码,访问search.php出现页面载入出错 。连接被重置 载入页面时到服务器的连接被重置。 // 加载 XS 入口文件 require_once '/home/who/xunsearch/sdk/php/lib/XS.php'; 这段包...
...unt(string $query=NULL) $query string 搜索语句, 若传入 null 使用默认语句, 调用后会还原默认排序方式 如果搜索语句和最近一次 search 的语句一样, 请改用 getLastCount 以提升效率 最大长度为 80 字节 {return} int 匹配的...
...性 交 了 一 百元 买 了 一次性 杯子 50 打 上面这句成功使用默认字典 下面自定义字典出错。 系统:apache php5 [b]Warning[/b]: scws_set_dict() [[color=#0000ff]function.scws-set-dict[/color]]: Failed to load the dict file in [b]D:\AppServ\www\rootwww\fc\test.php[...
版本:scws-1.1.0 监控方式:在linux下使用top指令 [quote='hightman' pid='3438' dateline='1267692528'] 是什么版本呢,新的版本应该是没有内存泄露了。 越来越大你的监控方式是什么呢?最好能给出较为准确的数据以便判断。 [/quote][hr...
xs-import进程是干啥用的?占CPU还不少~ 我使用命令将几百万数据导入以后,提示完成索引导入,但是查看系统top的时候 xs-import进程一直占着很大的cpu,并且data文件夹里的文件大小也一直在变化,是不是虽然索引导入完成,还有...
...l,host这类处理效果比较差,我们目前采用两个分析器配合使用来达到最好的效果,要是scws能处理得了像email,host,url和tag之类的分类,那效率应该是更棒了 谢谢你们的无私开源这么好的作品
在 scws.c 中,由于取词时使用一个 unsigned char 来记录分词的长度,存在特殊情况即通过 rules.ini 自动识别出来的词有可能超过 255 字,如全部连续的双字节数字或字母.超过 255 字后 这里的 j 将变得不正确可能导致 item-> 指向 NULL ,...