想把sogou的一些细胞词库整合到SCWS的词库里,要添加的词很多,不太可能用你提供的WEB查询工具一个个的去查找,怎么设置TF/IDF的值?
[quote='hpxl' pid='7811' dateline='1400033006'] sdk/php/app/demo.ini配置 [id] type = id [/quote] 是scws-1.2.2 的如何让它支持自已定义的英文词库? 像http://bbs.xunsearch.com/showthread.php?tid=3088 这样修改代码吗?
[quote='hightman' pid='3711' dateline='1284628104'] pscws2,3和scws-的词典不是共用的~~23用里面自带的那个旧词典才行。 [/quote] 我用的就是pscws23-20081221.tar.bz2这个包里边的字典。我单独写一个事例没的乱码,但加入ecshop了就有乱码了。
由于我刚刚了解scws的这个分词技术,我想请问一下高手,在一个文章里有很多的字,比如“我,的,在,”这些单字,是不是也会被分出来,我想问的是,能不能取出像地名,人名,词语, 我想在一个网站中应该这些,请问...
我想请教一下,我用scws分割了一篇文章,里面把一些词典库里收录了的四字成语分割成一个字一个字的了,这是为什么?有没有什么设置方法能让它被正确地分割出来的?谢谢了~
...XS scheme XSFieldScheme 获取当前在用的字段方案 XS scwsServer XSServer 创建 scws 分词连接 XS search XSSearch 获取搜索操作对象 XS Public 方法 隐去继承来的方法 名称描述定义于 __construct() 构造函数 ...
不是很明白,你说的自动分词??是什么意思 你在配置文件中不要指定 tokenizer 选项就会自动使用 SCWS 分词了。