本来按照Hightman的说明。我的文件放置的结构是这样的: “etc”:放置“自定义词典” 我的网站的目录结构是这样: [code]www【根目录】 |---mySite【子目录】 |---include【子目录】 |---使用分词功能的页面.php...
...12.38”一行),仍然分不出“空间”这个词。 还有如何设置才能识别出网址和邮箱等格式? 另外关于scws-gen-dict,按照github上的说明,可以进行.xdb到.txt转换,但是实际测试时显示没有-U这个选项,请问是取消了吗?如果是取...
...下载词典,用php扩展测试,无法对中文分词,把词典权限设置为777后依旧不行。 还有其他什么要注意的? 例如: [quote]早春装新款2014大码宽松长款韩版蕾丝衫雪纺衫打底衬衫[/quote] 分词结果: [quote]早春装新款 2014 大码宽松长...
...我自己的词库 //实例化分词插件核心类 $so = scws_new(); //设置分词时所用编码 $so->set_charset('utf8'); //设置分词所用词典(此处使用utf8的词典) $so->set_dict('/usr/local/scws/etc/dict.utf8.xdb'); //设置分词所用规则 $so->set_rule('/usr/local/scws/etc...
...的. [/quote] 安装了apache扩展,使用PHP进行调用,也可以设置读入内存? 如果可以的话,每次分词还要设置词典么?
词典没有正确放置或设置吧,看看你的 php.ini 中关于 scws.default.fpath 的设置
...开,却成了UTF-8的编码了,显示出乱码了! 不管怎么去设置,每次打开,都成UTF8的,按理说,我的GBK编码的文件,浏览器里应该是也是GBK的,但是却成了UTF8的了 所以我认为分词不正确的,也许是这个问题,但是我不知道为什...
...的. [/quote] 安装了apache扩展,使用PHP进行调用,也可以设置读入内存? 如果可以的话,每次分词还要设置词典么? [/quote] 这个要的, 仅仅对当前的那个 scws handler 有效, PHP程序一结束资源全部释放了
..., 但是在xunsearch中未找到此选项. 请问可否在xunsearch中设置? 先谢过! Thanks, Milton