搜索

大约有 213 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1960秒)

91.RE: 使用scws例子报错,附上全部细节,请大牛帮忙

发布时间:2013-05-07 09:05 t By hightman

scws_set_dict($so, '/dict.utf8.xdb'); scws_set_rule($so, '/rules.utf8.ini'); 问题在这里!!

92.RE:1251

发布时间:2008-04-26 08:04 t By hightman

...8.cht.php[/url] 引擎本身不需要更改, 只需要将rules.utf8.ini和dict.utf8.xdb改为繁体的词典即可. 词典制作参见相关代码里的工具 scws-1.0 里包含了词典制作工具. 顺便奉上之前整理制作的繁体数据. [url]http://www.hightman.cn/down/rules_cht.utf...

93.SCWS_XDICT_MEM模式

发布时间:2011-11-10 00:11 t By clearchen

ubuntu下,我把scws装成php的扩展, php调用时, $so->set_dict(ini_get("scws.default.fpath")."/dict.utf8.xdb",SCWS_XDICT_MEM); 如果去掉SCWS_XDICT_MEM,则分割同样的字符串时间增加, 请教这种模式的原理, apache 以loadmodule跑php,一次页面执行完毕后...

94.RE: 自定义字典的问题

更新时间:2011-03-16 22:03 t By zfzeng

[quote='hightman' pid='4118' dateline='1300201925'] set_dict("d:\test.xdb", SCWS_XDICT_XDB); 应该是这样而不是加引号 [/quote] 哦,写错了,确实是按斑斑写的呢样调用的,换成版版得字典就没问题,用我自定义的结果就是空[hr] 还有 set_dict("d:\test....

95.RE: 分词初试,结果不对

更新时间:2010-09-16 17:09 t By xiaowang19

...ws->set_rule(ini_get('scws.default.fpath') . '/rules.utf8.ini'); $cws->set_dict(ini_get('scws.default.fpath') . '/dict.utf8.xdb'); 再次运行,分词正确了[hr] 不过,又出现了奇怪的问题,我在原来的测试文本后面随便加了两个字母,分词又不对了。我继续增...

96.RE: 10秒 10元 这样的想做为一个词要怎么配置

发布时间:2011-10-29 01:10 t By hightman

你要用自定义词库 编写一个 dict_extra.txt 里面写上每个词,一个一行 然后调用 add_dict 加入词典

97.自定义词典产生的故障

更新时间:2012-04-29 20:04 t By yunxiaoad2

自定义了dict_user.txt 出现奇怪现象,所有词性都变成了string(3),而且还出现了乱码: array(3) { ["off"]=> int(0) ["attr"]=> string(3) "@�" ["word"]=> string(15) "重庆鸡公煲" } array(3) { ["off"]=> int(0) ["attr"]=> string(3) "ns�" ["word"]=> string(6) "重庆" ...

98.scws自定义词库可否自定义词性?

发布时间:2012-04-28 14:04 t By yunxiaoad2

我想在$prefix/etc/dict_user.txt内添加一些自定义词汇,有几个问题: 1、添加完是否需要重启xunsearch主进程?(实验结果是,求确认) 2、只监视dict_user.txt,还是会扫描、装载etc目录下所有的txt? 3、自定义词库后,系统内置词库...

99.自定义 SCWS 词库

...文件如下 (假设 $prefix 是您的安装目录) ~~~ $prefix/etc/dict_user.txt ~~~ 打开上述文件,文件开头已经有了相关注释和说明。这个文件就是自定义词库文件, 如果您同一台机器上装有多个 xunsearch 服务端,那么每个服务端独自使用...

100.“有空间”的分词有问题和扩充词典

更新时间:2013-05-18 14:05 t By lyjkensou

...有空 空间” 但实际结果是“有空 间” 即使通过scws_add_dict()添加了自定义的txt字典(里面只包含“空间 11.82 12.38”一行),仍然分不出“空间”这个词。 还有如何设置才能识别出网址和邮箱等格式? 另外关于scws-gen-dict,...

  • 时间不限
  • 按相关性排序