搜索

大约有 810 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0081秒)

711.大量添加新词到词典时怎么设置TF/IDF

发布时间:2011-11-05 23:11 t By dancebear

想把sogou的一些细胞词库整合到SCWS的词库里,要添加的词很多,不太可能用你提供的WEB查询工具一个个的去查找,怎么设置TF/IDF的值?

712.RE: 英文数字组合字符串分词问题

发布时间:2014-05-14 11:05 t By soarb

[quote='hpxl' pid='7811' dateline='1400033006'] sdk/php/app/demo.ini配置 [id] type = id [/quote] 是scws-1.2.2 的如何让它支持自已定义的英文词库? 像http://bbs.xunsearch.com/showthread.php?tid=3088 这样修改代码吗?

713.RE: 我想使用系统自动的分词功能,可是只看到有接口

发布时间:2011-11-28 12:11 t By icebolt

如果只是想实现分词,为什么直接用scws呢,何必用xunsearch呢?

714.RE: 如何使分词結果不包含一个單字的词?..

发布时间:2010-07-07 14:07 t By hightman

目前没有这个内置选项,建议在透过scws_get_result()取数据时自行排除...

715.RE: 请问一下,xdb与txt词库那个读取效率更高

发布时间:2013-06-29 22:06 t By hightman

后者是什么意思,举例说明一下吧。SCWS处理英文是按普通单词和数字的规则来做

716.RE: 加载字典出现乱码 pscws3

发布时间:2010-09-16 17:09 t By chenhu5200

[quote='hightman' pid='3711' dateline='1284628104'] pscws2,3和scws-的词典不是共用的~~23用里面自带的那个旧词典才行。 [/quote] 我用的就是pscws23-20081221.tar.bz2这个包里边的字典。我单独写一个事例没的乱码,但加入ecshop了就有乱码了。

717.高手请进,关于关键字的分词

发布时间:2010-12-19 09:12 t By stevenym

由于我刚刚了解scws的这个分词技术,我想请问一下高手,在一个文章里有很多的字,比如“我,的,在,”这些单字,是不是也会被分出来,我想问的是,能不能取出像地名,人名,词语, 我想在一个网站中应该这些,请问...

718.请问一下,怎么才能让词典里有的四字成语分割正确?

发布时间:2013-07-12 17:07 t By zhuaijay

我想请教一下,我用scws分割了一篇文章,里面把一些词典库里收录了的四字成语分割成一个字一个字的了,这是为什么?有没有什么设置方法能让它被正确地分割出来的?谢谢了~

719.XS

...XS scheme XSFieldScheme 获取当前在用的字段方案 XS scwsServer XSServer 创建 scws 分词连接 XS search XSSearch 获取搜索操作对象 XS Public 方法 隐去继承来的方法 名称描述定义于 __construct() 构造函数 ...

720.RE: 我想使用系统自动的分词功能,可是只看到有接口

发布时间:2011-11-24 23:11 t By hightman

不是很明白,你说的自动分词??是什么意思 你在配置文件中不要指定 tokenizer 选项就会自动使用 SCWS 分词了。

  • 时间不限
  • 按相关性排序