硬件配置 Core2 四核 2.4G 6G内存 370w数据 php 5.4 + xunsearch 1.4.7 web和xun在同一台主机 第一次查询最少需要2.8秒 第二次则会下降到0.6秒 使用xhprof调试发现瓶颈位于 XSServer::read 中的 fread() 占用的时间是整个php开销的98.1% 这个是存储性...
...字段排了序, 搜的时候 同步search->query($query)了3次, 第1次是主搜索limit(30,$start), 第2次是limit(1,0) 查一下搜出来的最高价, 第3次是limit(1,0) 查一下搜出来的最低价, 状况是这样的,有时候快,有时候慢,服务器CPU\内存\网络监...
[quote='net_li' pid='4355' dateline='1374126126'] 没人给解答下吗? [/quote] 可以使用1.4.7测试版本,这样就可以设置分词的setMulti属性,设置成11就能把所有单字都分出来,但是这样数据文件会变大,个人权衡效率问题吧
[root@VM71 php]# util/Indexer.php --source=csv --clean demo Object id #9 #0 lib/XS.php(2080): XSServer->read(8) #1 lib/XS.php(2065): XSServer->getRespond() #2 lib/XS.php(2042): XSServer->execCommand(Array, 201) #3 lib/XS.php(2003): XSServer->setProject('demo') #4 lib/XS.php(...
...执行词汇切割”进行分词,分词结果为“Array ( [0] => 璋 [1] => 冪 [2] => 敤 [3] => segment [4] => 鏂 [5] => 规 [6] => 硶 [7] => 鎵 [8] => ц [9] => [10] => 璇 [11] => 嶆 [12] => 眹 [13] => 鍒 [14] => 囧 [15] => 壊 ) ”,这感觉好像是编码格式的问题,代...
.../执行语句 $gSearch->setFuzzy()->setQuery($name)->addWeight('ranking','1')->setLimit($gNum,$startPage)->search(); //执行结果 Xapian::Query((疯:(pos=1) AND_MAYBE GD1))[hr] //输出结果 [0] => XSDocument Object ( [_data:XSDocument:private] => Array ...
...kenizer = split(,) non_bool = yes[/php] XS版本 xs-indexd: xunsearch/1.4.7-dev (index server) 查询结果没有任何变化,结果如下: [php]example_attr:jianyue,baise 45 ... jianyue,baise,qianhuang 207 ... zhongshi,hongse,baise 39 ... jianyue,baise,huangse 41 ... jianyue,heise,...
...------------------------------------------------------------------- '263':18 '8079':16 'bbs':5 'chenaishen':17 'com':7 'href':3 'http':4,12 'net':19 'org':15 'pgsql':1 'pgsqldb':6,14 'www':13 '中国':8 '社区':9 '论坛':10 (1 row) 下面是用鬼佬写的分词的结果,email,网址正确合...
2010年,scws 加上了翘首以盼的删减词库功能,该功能通过变通的办法解决,并非直接修改核心词库。下面详细介绍一下 scws-1.1.x 的更新日志及用法举例(示例以PHP扩展语言为例)。 最新版下载地址:[url]http://www.xunsearch.com/scws/do...
... => Array ( [word] => 鎴 [off] => 0 [len] => 2 [idf] => 0 [attr] => un ) [1] => Array ( [word] => 戞 [off] => 2 [len] => 2 [idf] => 0 [attr] => un ) [2] => Array ( [word] => 槸 [off] => 4 [len] => 2 [idf] => 0 [attr] => un ) [3] => Array ( [word] => 涓 [off] => 6 [len] => 2 [idf] => 0 [attr] => ...