搜索

大约有 200 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.3917秒)

91.scws加载词库和规则集失败,使用者为啥不知道呢?

更新时间:2010-12-09 22:12 t By lauxinz

...中不少都是词库没有加载上,却没有加以判断,结果发现分词结果不准确。 其实在scws文档中有这么一句话: [i][b]注:xdict_t 和 rule_t 分别是词典和规则集的指针,可判断其是否为 NULL 来判断加载的成功与失败。[/b][/i] 调...

92.1.1.2的 自定义字典无法使用

更新时间:2010-05-23 01:05 t By 逆雪寒

...->set_rule(ini_get('scws.default.fpath') . '/rules.utf8.ini'); 那么就分词正常. 这个是第一个问题. 第二个问题就是,定义自定义的词典. 看到说1.1.2 支持自定义的 txt 字典.于是我就这样写了 $so->add_dict(ini_get("scws.default.fpath") . '/dict.utf8....

93.RE: 自定义的 txt 字典 有关问题 求助

发布时间:2010-04-09 15:04 t By hightman

那个属性对分词效果有一定影响的,TF主要用于词的切分,IDF用于统计,词性就用在取TOP时过滤或标注上。 最好是基于现有的词典去补充,你重建一个的话数据又都没有效果可能会比较差。SCWS主页上有一个TF/IDF计算器,你可...

94.请教如何在Xunsearch里面设置scws的M选项(multi-child words mode)

发布时间:2012-02-23 17:02 t By Milton.Lai

Hi Hightman, 您好! 非常感谢您做的scws分词和xunsearch系统, 最近我们在做网站的搜寻服务, 考察了coreseek, sphinx-for-chinese 和 xunsearch 这三个系统, 觉得还是 xunsearch 比较适合, 因为词典制作和查询的方式都较另外二者灵活. 在今天做...

95.scws-1.1.2 发布, 修正人名识别失败的问题

发布时间:2010-05-09 02:05 t By hightman

...友发现部分情况搜索结果不全。经仔细排查问题在于 scws 分词中。 当采用非内存模式的词典时,返回的查结结果中(word_st)...->flag的属性包含怕 SCWS_WORD_MALLOCED 与 SCWS_ZFLAG_SYMBOL 定义冲突,以至于被当作符号文字从而未能进行正...

96.RE: 实时加载字典,服务器严重吃不消,有没有办法?

发布时间:2009-07-15 23:07 t By hightman

[quote='askie' pid='3233' dateline='1247660523'] 如果分词次数太多,很容易引起服务器假死,linux服务器! 请问老大有没有加载到内容进行调用的方法? [/quote] 当然有啊,你看一下说明吧. 我不清楚你用的是什么方式,是PHP还是c的API, set...

97.加载字典出现乱码 pscws3

发布时间:2010-09-16 16:09 t By chenhu5200

.../pscws3/pscws3.class.php'); $dict = './pscws3/dict/dict.xdb'; // 建立分词类对像, 参数为词典路径 $pscws = new PSCWS3(); $ignore = $autodis = true; $debug = $stats = false; $pscws->set_ignore_mark($ignore); $pscws->set_autodis($autodis); $pscws->set_debug($debug); $pscw...

98.最新的主要变动

...化代码兼容性 - 增加用户案例文档:USERCASE - 改进自定义分词器 XSTokenizerScws 接受参数作为复合等级 - 升级 libevent 到 2.x 版 - 修正中文 stopwords 不生效的问题 - 取消恼人的 NODB(S#506) 错误提示 - 新增获取文档匹配词表的接口 [XSSearch:...

99.RE: 1.1.2的 自定义字典无法使用

更新时间:2010-05-23 22:05 t By 逆雪寒

...et=utf8 scws.default.fpath=/usr/local/scws/etc 而php 是这样 //分词 $so = scws_new(); $so->set_charset('utf8'); // 这里没有调用 set_dict 和 set_rule 系统会自动试调用 ini 中指定路径下的词典和规则文件 $so->add_dict(ini_get("scws.default.fpath") . '/dict...

100.XSIndex

...取响应指令 XSServer scwsMulti int 获取当前索引库的分词复合等级 XSIndex socket mixed 获取连接资源描述符 XSServer xs XS 服务端关联的 XS 对象 XSServer Protected 属性 隐去继承来的属性 名称类型描述定...

  • 时间不限
  • 按相关性排序