另外,我碰到一个问题就是,这个同义词的功能时好时坏哎,有时候添加的同义词根本没有用,最主要的是,我一天测下来,估计只有一次是有效的!
问题是,我在现存的词上创建同义词,也不是无效的!!!不得不采用index search 的or 语法
文档里只提到 “title 标题型,标题或名称字段,至多有一个该类型的字段”,可以理解为不用标题型的也是可以的吧
不明白你说的。同义词是基于分词后的结果制作的。 如果你的索引先前制作,后面再添加自定义词,那么当然无效了。你要重建索引
...频,三列为词重,可是词频与词重是怎么计算的,单位是什么,词重是什么含义呢?为什么相同的词频,词重会有差别,如表中“新浪” 词重为6.26 还有,在实际应用中,是不是不用管词频的具体值,只用知道其大小关系就行...
用pscws4分词,为什么只打印出里面的数字,中文直接不分词打印,网页编码是utf8 function get_tags_arr($title){ require 'pscws4/pscws4.class.php'; $pscws = new PSCWS4(); $pscws->set_dict('scws/dict.utf8.xdb'); $pscws->set_rule('scws/rules.utf8.ini'); $pscws->set_ign...
[root@localhost xunsearch]# util/Indexer.php --source=test.csv --clean demo 清空现有索引数据 ... 初始化数据源 ... test.csv [XSException] util/XSDataSource.class.php(49): Undefined data source type: `test.csv' #0 Indexer.php(241): XSDataSource::instance('test.csv', NULL) #1 {main}...
REASON:CLOSED 说明是服务端关闭了连接。 超时了?你的情况像是服务器问题啊。 建议贴出你最近的 tmp/searchd.log 出错期间的内容,并注意监视操作系统的情况及日志
...我认为分词不正确的,也许是这个问题,但是我不知道为什么会是这样。 还有,我用类的形式写,打开是空白,什么都没,但是用另一种写,却没什么问题!