自己做个扫描程序,以文件名为key,内容为body建索引不就好了? xunsearch 本身并不是完整的搜索引擎,它是提供核心组件并附带一些例子
程序里面调用set_rule("d:\rule.ini"); 但是就算用从网站下载的rule文件,也还是报“Failed to load the ruleset file”。 怎么回事?
学习中看到,程序对于英文字串的处理时,定义TF的值为 = 2.5×log(#wlen),词长的自然对数的2.5倍。有什么实际意义么? 为什么是这个值呢?
系统关闭CORE生成 ulimit -c 0 或检查一下日志到底什么原因,这通常是程序异常退出导致的
什么意思 SCWS_XDICT_MEM 应该会比普通的慢吧,要加载到内存。 这个方式适合于常驻程序多次分词,WEB上不推荐。
[quote='hightman' pid='705' dateline='1333591381'] 自己做个扫描程序,以文件名为key,内容为body建索引不就好了? xunsearch 本身并不是完整的搜索引擎,它是提供核心组件并附带一些例子 [/quote] 如果是页面结构相似的网页,像H大这...
这是C/S程序,fread是从网络上读取数据。应该是你要看性能要看服务端的,你这个应该是文件系统没有缓存所以第一次比较慢。
...,数据全丢了... 啥情况啊[hr] 问题挺严重的,也是自己写的程序,平滑update了几条数据 结果就只有update的那几条数据,其他的全没了,太恐怖了...
2010-09-15: SCWS-1.1.3 Released. 将 cli/ 下的工具程序命名下划线改成连接线(减号), gen_scws_dict 改为 gen-scws-dict 消除 php5.3 的警告信息, 重写 phpext/ 中的部分zend API, 统一采用 zend_parse_parameters() 下载至 http://www.ftphp.com/scws/download.p...