...启缓冲区,默认 4MB,如 $index->openBuffer(8) 则表示 8MB // 在此进行批量的文档添加、修改、删除操作 ... $index->add($doc); ... $index->del($doc); ... $index->update($doc); ... $index->closeBuffer(); // 关闭缓冲区,必须和 openBuffer 成对使用 ...
...%B4%A2 比如这个:我搜得是 "那是你的笔记本电脑吗" 在 ff 浏览器下. ctrl + f5 强刷新下. 几次就会出现一两次 无法分词的问题. 去掉显式,就一点问题都没有了..我实在很无奈.. hightman 能加你 qq吗 我给代码和 php.ini 你看下...
...utf8编码,执行默认的test.php,产生乱码,不知道问题出现在哪?dict.utf8.xdb是新下载的没有动,非常感谢。 另外一个问题,我使用PSCWS4,是想在发布的文章内容中提取关键字,数量大约8个左右就可以了,get_tops()能满足吗?能按...
谢谢楼主 可我怎么找不到 PHP编写的xdb词典导入导出工具 下载地方呀, 并有朋友说,在命令行模式下运行,什么意思呀,
我们的BBS现在有一百五十万篇的帖子,接近四百个版面,分在十二个区块里,而且帖子数目很不均匀。目前我是将所有数据都放在一个库内,搜索速度只能说还行,差不多0.5秒一次。 这种情况下是按版面分库好还是按区块分...
...ws_get_tops($sh, 5); 另:我使用工具把默认的.xdb转化成.txt后在使用scws_get_tops()方法(字母+数据要大于8个才返回)。 我的邮箱lee1984@qq.com 新手!求帮助啊
没有特别去开进程来修改索引库阿. 我这里只是在数据有更新时才会执行性一次 --rebuild索引, 都是手工来做的. 我们现在的处理方式: 凌晨4:00 固定的去重起xunsearch, 如果没有做, 凌晨4:00多就挂掉。很奇怪,每天都这样。。
...面就是直接复制的48的代码,为什么会出错呢? 我直接在代码中修改那里呢? 上边指定的词库也是UTF8啊 您能否提供完整实例下载呢,直接查看您源码就是乱码,我要右键选择编码,完后复制的![hr] extension = scws.so scws.defaul...
明白你的意思了。。 但是我在重构呢,由于着急想知道结果,就用--fulsh命令,不过报错 [root@zhengmei util]# ./Logger.php --flush /export/home/www/xunsearch/data/products -c gbk [XSException] ../lib/XS.php(819): Missing field of type ID #0 ../lib/XS.php(522): XSFieldSc...
还有就是内存的问题,因为我希望在服务器端有个自动生成词库的功能,命令行方式不是很方便。 主要是用机器先自动分词,人工发现不合理,再把新词增加进去。