...zer = none [dh] index = both tokenizer = none ~ [/quote] 这样配置也不行 [id] type = id [user] index = both [zh] index = both [dh] index = both ~
这怎么是BUG呢,本来就是这样。只不过是在你没有任何词典的情况下它才默认加载默认词典。 并不是一开始就自动加载默认词典。。。
我也发现是这样的问题,我现在最新1.1.7,自定义一个词库后(),原词库就没有用了。 比如: new.txt(这个文件里,试过一个词也没有、添加个别词两种情况); $so = scws_new(); //$so->add_dict('', SCWS_XDICT_TXT); $so->send_text('广州...
...quote] 谢谢hm。还是更加期望加上直接入字典库的功能。这样更加方便,就是不知道难度如何。因为目前我的词库可能每天都有新的加进去。 PS:我是个有洁癖的代码工人:D:D:D
改成这样,scws_open 本身是没有函数的,文档是正确的,但附带提供的 scws.php 写错了,所以如果 ini_get('scws.default.charset')是utf-8那么就会按utf-8来, 所以应该 显式的调用 scws_set_charset() $cws = scws_open(); scws_set_charset($cws, "gbk"); scws_set...
...很难,站长有思路吗? 谢谢! [/quote] 抱歉,目前没有这样的php工具. 建议设想能运行 gen_dict, 而 pscws4 不推荐使用, 速度太慢. 地址匹配事实上应该针对地名名词(含缩写,别名)建立词库, 然后将其分词, 提取关键字进行比较, 如...
...义的词典. 看到说1.1.2 支持自定义的 txt 字典.于是我就这样写了 $so->add_dict(ini_get("scws.default.fpath") . '/dict.utf8.xdb'); $so->add_dict("/usr/myapp/dict_extra.txt",SCWS_XDICT_TXT); $so->set_rule(ini_get('scws.default.fpath') . '/rules.utf8.ini'); 结果分词...
... ubuntu linux环境,自编译安装 比如顶置的例子我这里是这样的 ; dict_extra.txt 我是新增词 2.0 再试一个 1.0 1.0 @ ; 以下词为删除项 删除 1.0 1.0 ! scws -d /usr/local/scws/dict_extra.txt -c utf-8 我是新增词 我...
...索 的时候加上 --show-query 可以查看拆词结果 。 [/quote] 这样 还是搜不出结果 php Quest.php demo 1 在 3,000 条数据中,大约有 0 条包含 1 ,第 0-0 条,用时:0.0016 秒。 php Quest.php demo 1 --show-query -------------------- 解析后的 QUERY 语...
...过 $doc->addTerm('date', '2011'); $doc->addTerm('date', '201111'); 这样就可以通过 date:2011 或 date:201111 检索到这篇文章 [/quote] 谢谢老大的指点,其实我的意思是比如有一条航线,其中这条航线有可能是2011-11-07起飞的,也有可能是2011-11...