搜索

大约有 144 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0055秒)

81.RE: 分词初试,结果不对

发布时间:2010-09-19 15:09 t By xiaowang19

我现在总结一下我目前还存在的问题 首先,步骤我都是按官方的说明来做的,然后下载官方我的演示程序(源代码另存为)。 UTF-8版本的一直不成功,分词结果就如我最开始的截图; GBK版本的在保存文件的时候选择文件编码为...

82.RE: 新版本SCWS-1.2.2的scws-gen-dict工具没有反向解压功能?

发布时间:2013-12-16 13:12 t By hightman

目前没有,计划将来添加一个 -r 参数用来解压

83.C版简易中文分词-cscwsd-0.0.3 发布

发布时间:2007-06-06 10:06 t By hightman

...上可以很方便在的各类 Unix-Like OS 系统下顺利编译执行。目前测试过的有 RedHat Linux (as3,as4) FreeBSD 4.x 5.x 6.x。目前只支持 GBK 编码。 这个小程序的基本工作方式如下:运行后在本地绑定一个端口(缺省是 4700)监听处理分词服...

84.XSSearch::setScwsMulti

...对设置之后的 setQuery 起作用, 由于 query 设计的方式问题, 目前无法支持搜索语句单字切分, 但您可以在模糊检索时设为 0 来关闭复合分词

85.RE: [HELP]xunsearch安装好了,搜索没有结果集。。。

发布时间:2011-10-27 16:10 t By hightman

...能 2.是否可以对scws自定义中文词典,方便扩展 [/quote] 目前没有直接支持自定义词典,而是直接读取 dict.utf8.xdb 你自己改词也必须转换成这个词典文件才能用。 词典转换关于SCWS的网站上有。

86.请问一下,xdb与txt词库那个读取效率更高

发布时间:2013-06-29 21:06 t By 阿弟2013

...的英文部分,包括email,url,host这类处理效果比较差,我们目前采用两个分析器配合使用来达到最好的效果,要是scws能处理得了像email,host,url和tag之类的分类,那效率应该是更棒了 谢谢你们的无私开源这么好的作品

87.RE: libscws的问题

发布时间:2009-12-04 13:12 t By nftw

...); 这句话出了问题, 也就是可能词典不正确. 但这个词典目前测试在64位系统下也是可以正常工作的, 检查一下词典的字节数是不是没有下载完整. [/quote] 谢谢您的回复,词典是用README中提供的命令生成的 /usr/local/scws/bin/gen_scws...

88.RE: 关于date 日期型字段

发布时间:2011-10-25 15:10 t By hightman

...要以类似于'20111025'这样的字符串形式插入? 2. 我的日期目前是以时间戳的形式储存的,而且确实有区间检索和排序的需求,那么我的日期是以numeric类型存储还是以date类型存储好?二者有什么区别? PS. 非常喜欢你们的这个...

89.RE: 关于词典中的词性标注

发布时间:2009-08-05 06:08 t By akira

...工具,已經完成 UTF8 chs + cht 的合併,也自己加了一些詞, 目前使用中,感覺很好。 想回應的是自己在合併過程中,碰到的情況。 在個別將 dict_chs(t).utf8.xdb 導出,倒入資料庫處理時發現,有重複的字詞,這部份不多: chs ...

90.自定义词库怎么控制(字母+数字)组合的个数

发布时间:2012-08-27 16:08 t By kill-all999

目前使用自定义词库实现分词,但是通过scws_get_top5()方法获取数据的时候(字母+数字大于等于3个的时候也会返回)。求过滤方案。 $sh = scws_open(); scws_set_charset($sh, 'utf8'); scws_set_dict($sh, './dict.txt', SCWS_XDICT_TXT); scws_set_rule($sh, './r...

  • 时间不限
  • 按相关性排序