希望能附上完整的PHP代码以及你的自定义词库,以做分析和测试。 从上面少结果的看,应该是词库不生效,而结果只按人名规则合成了2个人名,其它的按无效字符过滤。
在循环中,对同一字符串做分词,会出现不同结果,请问这是什么原因导致?非常感谢! 使用扩展词库结果: 大连金龙钢丝绳 、钢丝绳扣 、合成纤维吊装带 -> 连金龙|成纤维| 大连金龙...
1、xunsearch 运行时,批量生成索引时,消耗CPU和缓存如何计算? 2、xunsearch 运行时,用户搜索时,消耗CPU和缓存如何计算? 3、单库搜索支持多大并发,并发数受什么因素影响? 还有一个疑问,Xunsearch 的索引库是把数据缓存...
请问 类似 XSDocument::addTerm的操作 能否在批量导入sql数据生成索引时 实现?比如在自定义DataFilter里?
[quote='KnightE' pid='334' dateline='1323542477'] 应该尽量通过xs得到id,然后根据id批量从DB/NOSQL取信息,直接从xs取信息不是个好主意。 [/quote] 取信息可以从DB/NOSQL取信息,但是涉及到从XS过滤 就是个问题了
...,默认 4MB,如 $index->openBuffer(8) 则表示 8MB // 在此进行批量的文档添加、修改、删除操作 ... $index->add($doc); ... $index->del($doc); ... $index->update($doc); ... $index->closeBuffer(); // 关闭缓冲区,必须和 openBuffer 成对使用 ///////////...
老大,能把您的TF/IDF算法共享出来么?批量添加词库的时候真的很不方便啊,如果写个脚本调用你的[url=http://www.ftphp.com/scws/demo/get_tfidf.php]在线TF/IDF算法工具[/url],恐怕上万条请求你的服务器招架不住啊。。。 老大你的词库更...
...建索引 ... 初始化数据源 ... mysql://root:@localhost/shop 开始批量导入数据 (请直接输入数据) ... 完成索引导入:成功 16 条,失败 0 条 完成重建索引 ... [root@FPDev util]# php Indexer.php --clean fp 清空现有索引数据 ... 刷新索引提交 ... [...
初始化数据源 ... 开始批量导入数据 (请直接输入数据) ... [XSException] ../lib/XS.php(1971): Failed to recv the data from server completely (SIZE:0/8, REASON:closed) #0 ../lib/XS.php(1911): XSServer->read(8) #1 ../lib/XS.php(1896): XSServer->getRespond() #2 ../lib/XS.php(1880)...