[quote='hightman' pid='7112' dateline='1320310178'] 那些全被视为符号了。。。符号其实是指 词性为 un 的 [/quote] 那很奇怪,我用WINDOWS下的DLL ,他就不会把全角字符这个给去掉
在linux下装了scws1.1.2,并且装了php5的扩展,但是发现在分词时对于较长的字符串会自动截取前多少个字符进行切分,不知这是不是一个BUG?
... [/quote] 那很奇怪,我用WINDOWS下的DLL ,他就不会把全角字符这个给去掉 [/quote] 那应该是2者的词典不一样吧。。。你可以试试在不IGNORE的情况 下打印词情。
...再测试了自带的scws程序,加上-I选项后也是同样的,全角字符不显示 下面是我的测试。 [xxxxxx@www etc]$ scws -r rules.utf8.ini -d dict.utf8.xdb -c utf-8 -I 今天花了12万元啊 今 天花 了 万 元 啊 [xxxxx@www etc]$ scws -v scws (scws-cli/1.1.8: Sim...
...z 的问题,感谢网友(阿男)告知 3) 修正 scws.c 中某些字符在ignore symbol设置下无效的问题 4) 修正 1.1.4 的 xdb.c 270行处由于书写错误导致的严重错误, 1.1.4版作废应及时升为 1.1.5 下载地址:[url]http://www.ftphp.com/scws/download.php[/ur...
...SE_XATTR__ 宏中企图修改 xattr 的内容的作法, 当 xattr 为常量字符串时会出错. 2) 调整 config.h 的包含方式移入 .c 文件而非 .h 文件 3) 增加一些PHP测试脚本, 位于phpext/scws_test.php, 精选了一些岐义较多的语句进行测试。 4) 修正 scws_ha...
你默认的字符集是 gbk吧?请在 add_dict 前先调用 $so->set_charset('utf8'); 或者直接用 $so = scws_new('utf8');
在你们官网进行搜索,直接出: Error 500 Syntax: AND 这么明显的bug之前没有人提过?[hr] 这个漏洞非常严重,比如试试这个,直接把搜索引擎里面的所有数据都抓出来了!! http://www.xunsearch.com/demo/search.php?q=%EF%BC%81&f=_all&s=rele...
这个原因还是出自于 PDO 的字符集修正语句,应该统写为没有带引号的 utf8 兼容性最高。 如果您在使用 INDEXER 时一直有乱码现象,请按以下方法修改一下 $prefix/sdk/php/util/XSDataSource.class.php 详见补丁文件: [url]https://github.co...