想把sogou的一些细胞词库整合到SCWS的词库里,要添加的词很多,不太可能用你提供的WEB查询工具一个个的去查找,怎么设置TF/IDF的值?
我想在$prefix/etc/dict_user.txt内添加一些自定义词汇,有几个问题: 1、添加完是否需要重启xunsearch主进程?(实验结果是,求确认) 2、只监视dict_user.txt,还是会扫描、装载etc目录下所有的txt? 3、自定义词库后,系统内置词库...
问题是系统在使用自定义词库的时候,添加的词能不能算是基词?是否使用同义词的时候可以进行关联? 就目前的情况是添加了自定义词之后,如果这个词不算是基词,关联的同义词就无效、、、、
我用的是php_scws.dll (1.1.1) 程序设置、运行都已经正常,我如何建立自定义词库,又如何把自定义词库添加进来呢?恳请老大帮忙。谢谢,谢谢!
...环境),所以我只能用scws23了,但是词库我希望自己修改添加,但是XDB,这个格式我用了hightman提供的导入导出工具,就像[url=http://www.hightman.cn/bbs/showthread.php?tid=636]本网站的PHP的XDB导入导出工具[/url]里面提到的,我花了一些时间...
...两种情况 1.搜索语句是->setQuery('(味道恶心)'),结果是跟未添加词库时候一样的。 2.搜索语句是->setQuery('("味道恶心")'),结果是搜不出内容,而未添加词库时候是有结果的,而文档库的确含有该词的文档内容。 想问一下自定义...
...),如果每次加载词典都要把禁止词写到临时文件,然后添加,觉得有点过于麻烦。是否可以提供添加单个或多个词的函数? [/quote] 现在没有这个需求了,因为我的非法词库里面有英文的词语
...T_TXT);//新增词库 $cws->set_ignore(true); //var_dump($cws); //添加中文分词 $cws->send_text($a); dict_extra.txt 已经增加了一行:享鑫 1 1 n,但是“享鑫金属”还是只有金属被匹配出来
[quote='hightman' pid='3654' dateline='1280386250'] 其实你可以定时或某种其它方案把你的词库统一生成.XDB文件呀 [/quote] 这样做确实是可以,只是这时候文件就只是一个联系数据库和scws的一个中介,一个很临时的东西。我的意思是想可...