是不是你创建的XDB文件没有调用相应的optimize方法 ? php里有一个 $xdb->Optimize(); 这是在创建文件后必须调用的,即使不调用,效率也不会像你描述的这么慢吧。
...上drupal官网吧,不过我人太懒,再说吧 (上传不了tar文件,只好发连接了) 说实话,用drupal很久了,drupal的大缺憾之一,必然是搜索,接过很多商业站的单子,客户抱怨也在这里,英文还好,中文就是…… apache solr很烂...
...长词复合分法,比如 "奥迪A6/奥迪/A6" 2) 修正 pscws23 演示文件的一些写法与新版 PHP 不兼容 3) 修正一些 configure 检测错误 [b]scws-1.2.1 发布于 2013-1-15[/b] 1) 将源码迁移并托管到 github 2) 改进 C API 中 scws_fork() 的算法,使之更为合...
... [php] [/php] 結果在下面: [code] 原始文字:這個文件是為了測試英文:James是一位研究生。 這 => r 個 => q 文件 => n 是 => v 為了 => p 測試 => n 英文 => n SimpledCWS(Chinese Words Segment)/0.1.1 - by hightman [/code] 如同上...
...关文档 |- app/ 用于存放搜索项目的 ini 文件 |- lib/XS.php 入口文件,所有搜索功能必须且只需包含此文件 \- util/ 辅助工具程序目录 |- RequireCheck.php 用于检测您的 PHP 环境是...
...定您要编写一个名为 `xyz` 的分词器,则您要编写的代码 文件为 `XSTokenizerXyz.class.php`,请将文件统一放入 `$prefix/sdk/php/lib` 目录。 通常来讲,您只需要实现 [XSTokenizer::getTokens] 即可。该函数接受 2个参数,分别为要分词的值以及 ...
...,函数scws_set_dict和scws_add_dict加载一个大小为58K的txt字典文件的时候出现了递归的堆栈溢出。但是我将该txt字典转换成xdb文件后再次调用,就不会出现该问题了? 但是如果资源使用txt文本,参数使用SCWS_XDICT_XDB,也不会有问题...
...分词 我用FTP传到服务器上,却不行了 说明一下:所有文件编码都GBK,但是传到FTP上,用浏览器打开,却成了UTF-8的编码了,显示出乱码了! 不管怎么去设置,每次打开,都成UTF8的,按理说,我的GBK编码的文件,浏览器里应该...
我安装的路径是 " /usr/local/xunsearch",同时我把文件夹里面的data软连接在"/mnt/xunsearch/x/data", 由于网站存放的文件夹和迅搜存放的文件夹没在同一个文件夹内。 所以存在权限的问题,想必很多人跟我一样,出现错误。 我把安装...
...个问题想要请教哥们: 现在需要对一批中文的文本文件建立检索功能 现在的初步想法是 使用util/Indexer.php一行一行的将所有文本信息全部导入xs-searchd的一个project实例中 (我对php不是特别熟悉 又需要尽快的实现这...