...后面跟上1,2个字,并且这些字不在排除范围内的(一般不会用到名字里的字)那么就视为一个人名。大前提是这些都是散字,不在词库里。
[quote='hightman' pid='3936' dateline='1293723309'] 那不会吧,PHP的错误日志有没有呢。。。这个脚本对我自己也没用,你或许应该参见一下帮助,是否字符集正确?用法参数是否正确,实在不行自己加断点简单调试一下。 [/quote] 我知...
500万条数据可以分段来读取,比如每次10000条,就不会出现上面的php错误了。判断是不是某条数据是不是已经存在了,可以根据主键来判断是不是已存在,存在的跳过就可以了。例如: [php]$query = "id:1753"; $docs = $xs->search->search($q...
...加入一句 $scws->add_dict('/path/to/del.txt', SCWS_XDICT_TXT); 如果您不会制作词典可以从 http://www.ftphp.com/scws/download.php 重新下载 [code] ; /path/to/del.txt 民医院 1 1 ! [/code]
...提示。所以他不应该是停止,而是重建索引了(但是db.re不会改名db) 2、我执行完毕后--stop-rebuild之后,再使用--rebuild,也会提示DB has been rebuilding,我换了服务器版本(包括目录)也是这样。 现在我只能使用--stop-rebuild来建索...
是不是你创建的XDB文件没有调用相应的optimize方法 ? php里有一个 $xdb->Optimize(); 这是在创建文件后必须调用的,即使不调用,效率也不会像你描述的这么慢吧。
...,比如 192.168.1.1 以前会被切成 192.168 和1.1 2个数字,现在不会了。 5.libscws 安装后将所有的头文件(*.h)按装到 $prefix/include/scws 而不是以前的 $prefix/include,故采用C API开发时头部建议写 #include 下载地址:[url]http://www.ftphp.com/scws/dow...
search.log 的生成是有一些规则判断和调整的,并不是如你所说的。自定义词典也会纳入考虑,但过于复杂的搜索语句是不会记录的。