搜索

大约有 20 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1000秒)

1.关于词库导入的问题!

更新时间:2010-06-05 15:06 t By huangxyun

...的词库,不想要那么多大的词库,为什么我导出词库重新生成之后会出一大堆错误,在make_xdb_file.php以下两行出错。 if ($v['part']) $flag |= 0x02; $data = pack('ffCa3', $v['tf'], $v['idf'], $flag, $v['attr']); 我的词库是UTF8的。 我提供一个导...

2.RE: 集成包怎么用自定义词库

发布时间:2011-09-20 15:09 t By hightman

词库在 $prefix/etc/dict.utf8.xdb 您用制作好的 scws 词库支替换它即可,词库生成办法要看看 scws 的帮助,此外字符集必须是 UTF-8

3.RE: 集成包怎么用自定义词库

发布时间:2011-09-21 13:09 t By hightman

目前不行。只能自己生成 scws 的词典并放进 $prefix/etc/dict.utf8.xdb 覆盖 词典可以自己先制作TXT格式在利用SCWs提供的工具转换成XDB格式 [url]http://www.hightman.cn/bbs/showthread.php?tid=712[/url] 这个贴子后面有讲到

4.[特别提供] 纯PHP编写的sqlite词典工具!!

更新时间:2010-07-08 22:07 t By limaoxiang

...一些时间DEBUG后也用不了(导出txt总是内存溢出,而由txt生成的XDB在scws23也无效)!最后,我放弃了XDB,但是嘛,直接用TXT也不好,内存占用太大,效率也低。后面,我分析了一下demo程序,就借用作者的程序形成了sqlite的工具了...

5.RE: 能否提供字典dict.xdb的生成程序

发布时间:2009-06-28 21:06 t By hightman

[quote='heraldboy' pid='3191' dateline='1246183006'] 谢谢,我找到了,但是我不懂C,现在用的是PSCWS/4.0,我希望有个PHP的字典格式转换程序,我下午分析了一下你的读取代码,本人水平有限,感觉很难。 如果你能提供一个windows下的可执...

6.增加词“中国梦”遇到的问题

发布时间:2013-09-25 15:09 t By kaiwenli

需要增加一个新词“中国梦”。 使用的php XDB工具,增加词库后导入生成xdb文件。 重新生成coreseek的索引 索引的时候还是搜不出来这个词。 我确认使用的是utf-8 no-bom头的格式。 请问如何解决。谢谢

7.使用自定义词库的时候,部分词会丢失

更新时间:2014-04-18 17:04 t By tianly

...码的,已经分别试过使用PHP版词库工具以及scws-gen-dict来生成词库,但是结果都一样。 有什么可能的原因吗? 谢谢 [hr] 我使用的代码如下, dict.utf8.xdb是我自己的词库 //实例化分词插件核心类 $so = scws_new(); //设置分词时所...

8.RE: 对医院的分词不太理想

更新时间:2010-09-07 18:09 t By hightman

...居然有个错误的词叫“民医院”!! 建议删除该词重新生成词典或,写一个附加词典标记为删除。内容如下,保存为名字 del.txt,然后在分词前加入一句 $scws->add_dict('/path/to/del.txt', SCWS_XDICT_TXT); 如果您不会制作词典可以从 http://...

9.能否提供新功能

发布时间:2011-01-04 10:01 t By xjpeter

...组的格式请参考示例,key为词语,value为词频。 这样生成词库,相当有方便,能否也增加一下

10.RE: 关于SCWS基于HTTP/POST的分词API的一个问题

发布时间:2011-04-19 15:04 t By tuzwu

...d='4506' dateline='1303195392'] 新版会开发一个API直接在函数里生成临时词库供调用。 [/quote] 感谢管理员回复. 其实我的意思大概可以简化为: 最长分词模式. 分出来的词要达到符合语法的最长.这个难度估计不小,呵呵,也可能是比较...

12
  • 时间不限
  • 按相关性排序