搜索

大约有 278 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.2932秒)

191.RE: 添加自定义词库的问题

发布时间:2010-06-04 16:06 t By hightman

请注意仔细看说明啊。 词典越往后添加的优先级越高。所以你把TXT的放在XDB后面为佳。否则2者冲突时以后者为准。

192.XSIndex::getCustomDict

...INDEX_USER_DICT, XS_CMD_OK_INFO); return $res->buf;} 获取自定义词典内容

193.RE: 请问scws分词如何实现优先级

发布时间:2010-12-30 17:12 t By hightman

提升在词典中的 tf 值

194.RE: 怎样才能 字母数字汉字组合 按照词典分成一个词语呢?

更新时间:2013-07-03 16:07 t By shuyinglee

我这个是简单的改动,就是注释掉了一段代码 [code] diff -ur scws-1.2.1/libscws/scws.c scws-1.2.1.changed/libscws/scws.c --- scws-1.2.1/libscws/scws.c 2013-01-11 10:39:28.000000000 +0800 +++ scws-1.2.1.changed/libscws/scws.c 2013-07-03 10:38:49.409846632 +0800 @@ -60,6 +60,9 @@ s->...

195.RE: 加载字典出现乱码 pscws3

发布时间:2010-09-17 11:09 t By hightman

哦可能ecshop用的不是GBK的?你下载的默认应该 是gbk 的词典

196.RE: ubuntu 64位无法分词

发布时间:2013-11-05 14:11 t By hightman

全是 /un 应该是词典不工作。这个词库应该是不依赖机器字节序的啊 TXT没有提供下载,但我们提供了PHP的脚本可以将XDB转换成TXT

197.RE: 关于多粒度的建议

发布时间:2014-02-18 11:02 t By tongkaiteng

我遇到的问题和你应该一样,我词典里有 内衣和保暖内衣,当我对句子 保暖内衣进行分词的时候,确只分出来 保暖内衣,而丢失了内衣词。请问,有没有人知道怎么解决,在线等待!!

198.英文可以自定义词性吗?

发布时间:2013-08-30 05:08 t By mynoname

通常英文是不需要分词的,但很多时候词性是需要的,比如nike,dior这类品牌英文。 目前默认词性都是en,有什么办法可否自定义词典来改变他的词性。 还有个问题,就是纯数字的词性为什么是en呢,不是m? 望赐教。

199.RE: 搜索问题

更新时间:2012-10-25 13:10 t By hightman

那样就不是全文检索了,大概有几种办法: 1. 你把词典删除就可以搜索单字了。etc/dict.utf8.xdb ... 2. 或者要强制检索单还可以考虑修改C代码的部分,修改 src/import.h #define DEFAULT_SCWS_MULTI 3 把 3 改为 15 然后重新...

200.关于数词、量词

更新时间:2013-12-03 14:12 t By luopuya

...的,没有按tf-idf来算? 因为量词太多,不可能一个个从词典用!删去……

  • 时间不限
  • 按相关性排序