今天又在网站上重新下载了 简体utf8 xdb字典,和make_xdb 等软件,做次操作, xdb->txt 再txt->xdb 就不行了,直接报错! 麻烦版主测试一下,给一个修改字典的方法,谢谢!
1. 你的词典只有“再试一个”这个词,当然就只有它了 2. scws_new/scws_free 是C 里的函数,在PHP中是 scws_open/scws_close 建议在PHP中用对象方式使用 scws 即 $so = scws_new(); $so->set_charset('gbk'); $so->set_dict(...
呃,如此看来只能猜想是不是跟php-fpm有点关系,但不合常理:( 您可否转到cli方式下用命令行测试几次看看
我之前测试都是在自己的电脑上,可以安装SCWS的插件,但是我现在想把网站移植到都网络上,才发现虚拟服务器没有办法安装分词插件,那我还能有什么办法呀? 非常感谢!!
第 2. 点你可以对分类 id 不为 0 的统一在做索引时 $doc->addTerm('cid', 'have') 然后在搜索的时候 $search->addWeight('cid', 'have') 来提权
...么意思 你在配置文件中不要指定 tokenizer 选项就会自动使用 SCWS 分词了。 [/quote] 嗯,可能描述不清。 我就是想有一段文字,然后根据这段文字分词,实现类似tag这样的功能。其实和引擎关系不大,如果没有这个功能的话...
是你自己搞错了! “是一”本身不是词,只是因为二元结合法所以scws自动将其合成为一个词。 复合分词是对原本是词的长词情况处理的,比如”中国“可以切成”中“+”国“+”中国“ 你的问题必须是 [code] $tk = $tokenizer->s...
这些 PHP 工具在发布时都有测试通过,但PHP版本众多,加上各自配置又不一样,所以难免还有问题。目前 PHP 的工具部分照顾不过来,请尝试自行修正一下。 计划在下一版本中直接在 gen-scws-dict 中提供C版的工具,不要再通过PHP了