参见 [url]http://www.ftphp.com/scws/[/url] 下载上面的 php_scws.dll 并按照文档的说法安装吧
编译scws调试版本: ./configure --prefix=/usr/local/scws --enable-developer gmake 之后在cli和libscws目录生成了Makefile文件,其中CFLAGS=-g -O2,这里最好把O2选项去掉,避免调试的时候出现源码和代码对应不上的情况。
目前不行。只能自己生成 scws 的词典并放进 $prefix/etc/dict.utf8.xdb 覆盖 词典可以自己先制作TXT格式在利用SCWs提供的工具转换成XDB格式 [url]http://www.hightman.cn/bbs/showthread.php?tid=712[/url] 这个贴子后面有讲到
...了! “是一”本身不是词,只是因为二元结合法所以scws自动将其合成为一个词。 复合分词是对原本是词的长词情况处理的,比如”中国“可以切成”中“+”国“+”中国“ 你的问题必须是 [code] $tk = $tokenizer->setDuality(f...
在另一帖子中回复您的,我猜测是您的 scws 对像字符集没有正确指出,而 php.ini 默认设为 gbk导致,建议显式地指定字符集 $so = scws_new('utf8'); 或在任何 add_dict 之前调用 set_charset
繁体分词演示: [url]http://www.hightman.cn/demo/scws/v48.cht.php[/url] 引擎本身不需要更改, 只需要将rules.utf8.ini和dict.utf8.xdb改为繁体的词典即可. 词典制作参见相关代码里的工具 scws-1.0 里包含了词典制作工具. 顺便奉上之前整理制作的...
[quote='hightman' pid='7092' dateline='1319384262'] 如果你还需要原来的词典,请在 add_dict 前加 set_dict(ini_get('scws.default.fpath').'/dict.utf8.xdb'); [/quote] 是的。这没问题了。是那txt编码问题。不是utf8的话就不行的。 scws我是用utf8。
要命了,管理员请指点: linux命令行执行: scws 北京大学 -c utf8 -d /usr/local/scws/etc/dict.utf8.xdb -M 3 返回: 北京大学 北京 大学 php调用system执行同样的命令,返回4个单字。
...directory 请确认安装目录:/usr/local/xunsearch [Y/n]y Checking scws ... 1.2.3-dev Checking scws dict ... ok Checking libuuid ... yes: /usr/local/xunsearch Checking xapian-core-scws ... 1.2.15 Checking libevent ... 2.0.21-stable Extracting xunsearch package (1.4.8) ... Configuring x...
... + n = 5 即可 我们的DEMO已经更新,[url]http://www.xunsearch.com/scws/demo/v4.php[/url] 您也可以参见我们的 GITHUB 日志:[url]https://github.com/hightman/scws/commit/53269c304f6f8b84263ed18522152eb3b070c51a[/url]