搜索

大约有 200 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0061秒)

61.scws分词乱码问题,求解

发布时间:2012-07-17 16:07 t By wainilxx7

...码也是用的gbk。 然后我用记事本打开XDB 格式的词典文件dict.xdb,效果如下: XDB"/B ? ?? 悯H@   % G ! ? ! p # Z  #  ! ? # ? ) ? ! ? !  ! ? % ? ! ? ! ;* # P- # -0 ! ? % ? # ? # 5= # A ! 鰾 ! tG ! bJ ' ㎜ ! 頝 # 稱 ! zT ! dV ! AY '...

62.XSTokenizerScws

...描述定义于 __construct() 构造函数 XSTokenizerScws addDict() 添加分词词典, 支持 TXT/XDB 格式 XSTokenizerScws getResult() 获取分词结果 XSTokenizerScws getTokens() XSTokenizer 接口 XSTokenizerScws getTops() 获取重要词统计结果 X...

63.RE: 集成包怎么用自定义词库?

发布时间:2011-09-21 13:09 t By hightman

目前不行。只能自己生成 scws 的词典并放进 $prefix/etc/dict.utf8.xdb 覆盖 词典可以自己先制作TXT格式在利用SCWs提供的工具转换成XDB格式 [url]http://www.hightman.cn/bbs/showthread.php?tid=712[/url] 这个贴子后面有讲到

64.RE: 使用scws例子报错,附上全部细节,请大牛帮忙

发布时间:2013-05-07 09:05 t By hightman

scws_set_dict($so, '/dict.utf8.xdb'); scws_set_rule($so, '/rules.utf8.ini'); 问题在这里!!

65.SCWS_XDICT_MEM模式

发布时间:2011-11-10 00:11 t By clearchen

ubuntu下,我把scws装成php的扩展, php调用时, $so->set_dict(ini_get("scws.default.fpath")."/dict.utf8.xdb",SCWS_XDICT_MEM); 如果去掉SCWS_XDICT_MEM,则分割同样的字符串时间增加, 请教这种模式的原理, apache 以loadmodule跑php,一次页面执行完毕后...

66.为什么程序消耗的内存越来越大

更新时间:2010-03-02 17:03 t By backluck

...(-1); } scws_set_charset(s, "gbk"); scws_set_dict(s, "/usr/local/scws/etc/dict.xdb", SCWS_XDICT_XDB); scws_set_rule(s, "/usr/local/scws/etc/rules.ini"); for(i = 0; i < 1000000; i++){ scws_send_text(s, text, strlen(text)); while (res = c...

67.自定义字典的问题

发布时间:2011-03-14 22:03 t By zfzeng

... 番茄汤(分词OK) 可是结果什么都没显示。 $so->set_dict("d:\test.xdb", "SCWS_XDICT_XDB") 的调用也正常。 不知道哪里出了问题?

68.RE: 分词初试,结果不对

更新时间:2010-09-16 17:09 t By xiaowang19

...ws->set_rule(ini_get('scws.default.fpath') . '/rules.utf8.ini'); $cws->set_dict(ini_get('scws.default.fpath') . '/dict.utf8.xdb'); 再次运行,分词正确了[hr] 不过,又出现了奇怪的问题,我在原来的测试文本后面随便加了两个字母,分词又不对了。我继续增...

69.RE: 1.1.2的 自定义字典无法使用

更新时间:2010-05-23 22:05 t By 逆雪寒

... $so = scws_new(); $so->set_charset('utf8'); // 这里没有调用 set_dict 和 set_rule 系统会自动试调用 ini 中指定路径下的词典和规则文件 $so->add_dict(ini_get("scws.default.fpath") . '/dict.utf8.xdb'); $so->add_dict("/usr/myapp/dict_extra.txt",SCWS_XDICT_TXT); $so->se...

70.RE: Windows7 分词准确率极低

更新时间:2010-12-31 02:12 t By pittece

...呢?[hr] 事实上,$hdr['fsize'] = 13245833, 而$fstat['size']就是dict.xdb文件的大小4497408 ,那为什么$hdr['fsize']会等于13245833呢?

  • 时间不限
  • 按相关性排序