我是 centos5 scws 1.1.2 php 以扩展形式安装 . 如果我不显式的定义 $so->add_dict(ini_get("scws.default.fpath") . '/dict.utf8.xdb'); $so->set_rule(ini_get('scws.default.fpath') . '/rules.utf8.ini'); 那么就分词正常. 这个是第一个问题. 第二个问题就是...
改成这样,scws_open 本身是没有函数的,文档是正确的,但附带提供的 scws.php 写错了,所以如果 ini_get('scws.default.charset')是utf-8那么就会按utf-8来, 所以应该 显式的调用 scws_set_charset() $cws = scws_open(); scws_set_charset($cws, "gbk"); scws_set...
我把php_scws.dll放在php的扩展目录了,也下载了以下三个文件放在D:/PHP/SCWS/里面 dict.utf8.xdb rules.ini rules.utf8.ini rules_cht.utf8.ini 然后在php里也由设置了 [scws] extension=php_scws.dll scws.default.charset=utf8 scws.default.fpath="D:/PHP/scws" 但是...
有没有含有简体中文的gbk规则集文件啊。我在http://www.ftphp.com/scws/download.php#dll处下的文件包括rules.ini rules.utf8.ini rules_cht.utf8.ini 这三个文件,这貌似没有gbk的规则文件吧?但是pscws23只能用gbk。请问这怎么办
我直接这么有会有这两个警告。 Warning: scws_set_dict() [function.scws-set-dict]: open_basedir restriction in effect. File(C:\Program Files\scws\etc\dict.utf8.xdb) is not within the allowed path(s): (D:/DedeAMPZ/WebRoot/Default) in D:\DedeAMPZ\WebRoot\Default\tld\dede\getwen.php on line...
...我确定我市完全按照你说的做的 php.ini 是这样的配置 [scws] extension=scws.so scws.default.charset=utf8 scws.default.fpath=/usr/local/scws/etc 而php 是这样 //分词 $so = scws_new(); $so->set_charset('utf8'); // 这里没有调用 set_dict 和 set_rule 系统...
php.in 的配置 [scws] extension=php_scws.dll scws.default.charset = utf8 scws.default.fpath = "e:/soft/xunsearch/scws" e:/soft/xunsearch/scws目录下的文件: dict.utf8.xdb rules.ini rules.utf8.ini rules_cht.utf8.ini 重新启动apache发现已经启动了这个extention. php 代...
楼主,为什么不能发新帖了啊。我用1.18 php_scws.dll(2) 对应的php版本为 5.2.3 完全按照文档目录 php_scws.dll/Win32 安装说明 这个上面做的。而且安装完扩展之后echo phpinfo();也看到了 scws服务已经有了。 在运行时加了 scws.default.charset...
...句后面再补上两句(参考GBK版本): $cws->set_rule(ini_get('scws.default.fpath') . '/rules.utf8.ini'); $cws->set_dict(ini_get('scws.default.fpath') . '/dict.utf8.xdb'); 再次运行,分词正确了[hr] 不过,又出现了奇怪的问题,我在原来的测试文本后面随便加...
繁体分词演示: [url]http://www.hightman.cn/demo/scws/v48.cht.php[/url] 引擎本身不需要更改, 只需要将rules.utf8.ini和dict.utf8.xdb改为繁体的词典即可. 词典制作参见相关代码里的工具 scws-1.0 里包含了词典制作工具. 顺便奉上之前整理制作的...