搜索

大约有 236 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0049秒)

151.RE: 自定义“词性”

更新时间:2010-06-29 21:06 t By hightman

可以的啊,用SCWS_XDB工具导出成TXT格式就可以编辑了. 但要注意词性最多2个字符,不可以是#和@和!,这三个有特殊函义

152.新手問題

更新时间:2010-07-29 13:07 t By user1000

1. 請問idf怎麼算呀?這有什麼意思? 2. send_text之後,PHP中怎麼看到tf呢?[hr] 请问xdb里的tf idf是那来的计数据呢?

153.PSCWS23 词典文件如何制作

发布时间:2011-11-28 11:11 t By alicar

PSCWS23 词典文件如何制作 xdb导入导出工具导出信息如下 ---------------------------------- # WORD TF IDF ATTR ---------------------------------- 除了表头,一个都没导出。。。。。。

154.RE: 增加词“中国梦”遇到的问题

发布时间:2013-09-25 16:09 t By hightman

你生成的xdb应该先用scws自带的工具测试一下。

155.RE: 添加自定义词库的问题

发布时间:2010-06-04 16:06 t By hightman

请注意仔细看说明啊。 词典越往后添加的优先级越高。所以你把TXT的放在XDB后面为佳。否则2者冲突时以后者为准。

156.怎么回事呢 ?

发布时间:2011-08-08 14:08 t By assad

自定义词库加载不上,是什么原因呢? $cws = scws_new(); $cws->set_charset('utf8'); $cws->set_dict('/usr/local/scws/etc/dict.utf8.xdb'); $cws->set_dict(BASE_PATH.'admin/data/dict/wo.txt',SCWS_XDICT_TXT);

157.抛个砖:libscws的perl 扩展,比较粗陋

发布时间:2008-01-14 21:01 t By xueron

不知道hightman能否丢出一个utf-8的xdb测试一下。多谢了先!!

158.RE: ubuntu 64位无法分词

发布时间:2013-11-05 14:11 t By hightman

全是 /un 应该是词典不工作。这个词库应该是不依赖机器字节序的啊 TXT没有提供下载,但我们提供了PHP的脚本可以将XDB转换成TXT

159.ubuntu 64位无法分词

发布时间:2013-11-05 12:11 t By luopuya

ubuntu13.04是用amd64.iso在虚拟机里安装的 分词几乎都是un 而在另一个32位ubuntu上则正常 字典是完好的的xdb 顺便问下有无txt格式的字典下载,用scws_gen_dict生成不知道行否

160.RE: 搜索问题

更新时间:2012-10-25 13:10 t By hightman

...办法: 1. 你把词典删除就可以搜索单字了。etc/dict.utf8.xdb ... 2. 或者要强制检索单还可以考虑修改C代码的部分,修改 src/import.h #define DEFAULT_SCWS_MULTI 3 把 3 改为 15 然后重新编译并重建索引就可以了 3. 用自定...

  • 时间不限
  • 按相关性排序