想把sogou的一些细胞词库整合到SCWS的词库里,要添加的词很多,不太可能用你提供的WEB查询工具一个个的去查找,怎么设置TF/IDF的值?
...sphider,数据存储的字段也可以参照sphider。 xunsearch只是提供了一个快速搜索的解决方案,具体代码都得自己实现的喔。
用了网上的演示,这个分词系统挺好用的.但是本人是PHP新手,使用win7平台,hightman大侠提供的好像是一个中文分词引擎,不知道怎么直接在我的php空间上激活。请问我自己要怎么实现演示页面的显示效果呢?
ERR_XAPIAN 的话你可以看一下 tmp/searchd.log 看看里面应该有相关的错误 或直接打印 XSException 的错误信息应该也有相关描述。 把错误信息提供全面一点我也看看
...v['tf'], $v['idf'], $flag, $v['attr']); 我的词库是UTF8的。 我提供一个导出的附件,高手们能否看看。[hr] 我是利用原词库UTF8的,导出之后,删掉了一部分,重新生成的。
目前不行。只能自己生成 scws 的词典并放进 $prefix/etc/dict.utf8.xdb 覆盖 词典可以自己先制作TXT格式在利用SCWs提供的工具转换成XDB格式 [url]http://www.hightman.cn/bbs/showthread.php?tid=712[/url] 这个贴子后面有讲到
目前似乎还没有和PGSQL全文搜索的整合. 由于自身没有这方面需求(全文检索均已采用 XUNGLE 单独提供, 而不是直接借助SQL), 所以短期内也没有这个计划.
...方这样的操作方式来解决一些循环的数据。 以下是官方提供的: $index->openBuffer(); // 开启缓冲区,默认 4MB,如 $index->openBuffer(8) 则表示 8MB // 在此进行批量的文档添加、修改、删除操作 ... $index->add($doc); ... $index->del($doc); ...
先谢谢highman提供了这么方便的分词工具! 使用中发现,在字典的建立过程中,及php make_xdb_file.php 报了一大堆警告: Notice: Undefined index: tf in C:\xampp\php\xdb\make_xdb_file.php on line 93 Notice: Undefined index: idf in C:\xampp\php\xdb\make_xdb_file.p...