版主您好,我在自定义词表里加了一些数字+字母的词,如pm2.5,101大楼这样。 使用的时候发现无法正常分出来,我看到新版是加了一些强制拆分的功能,但是对自定义词表里的词,也是强制拆分的码?
你要在 phpext/ 目录执行 phpize ,此外,很多LINUX系统自带了 php/phpize 而它的版本比较陈旧并不是你最新安装的。建议你用全路径: /alidata/.../php/bin/phpize
在另一帖子中回复您的,我猜测是您的 scws 对像字符集没有正确指出,而 php.ini 默认设为 gbk导致,建议显式地指定字符集 $so = scws_new('utf8'); 或在任何 add_dict 之前调用 set_charset
转眼间距离 libscws-pre 发布已经半年多了, 这段时间来 scws 伴随着 [url=http://www.ftphp.com]ftphp[/url] 不断的改进和成长, 现在忙里偷闲将 scws 代码整理发布, 并使用 Autoconf, Automake 工具打包发布, 方便大家安装和使用, 也感谢大量网友的...
前几天在一台32位的linux上成功安装了scws 1.1.1版本,今天看到发布了1.1.2的版本,就在一台64位的机器上准备安装。依然遵循1.1.1版本的安装步骤,却发现出错了: 看代码: [code] [root@localhost phpext]# ./configure --with-scws=/usr/local/scws...
...安装时候失败 下面是我的安装过程 wget http://www.ftphp.com/scws/down/scws-1.1.7.tar.bz2 tar jxvf scws-1.1.7.tar.bz2 cd scws-1.1.7 ./configure --prefix=/usr/local/scws-1.1.7 make make install ls -al /usr/local/scws-1.1.7/lib/libscws.la /usr/local/scws-1.1.7/bin/scws -h #...
好象IP地址也分了.比如:192.168.0.1,结果是: No. WordString Attr Weight(times) ------------------------------------------------- 01. 192.168 en 4.86(1) 02. 0.1 en 2.75(1) http://www.163.com No. WordString A...
[quote='hightman' pid='8876' dateline='1333164684'] txt词库其实也是转换成XDB再调用的,不用担心性能。 你合并词典很简单啊,把 dict.utf8.xdb 导出来嘛 [/quote] 谢谢hm。还是更加期望加上直接入字典库的功能。这样更加方便,就是不知...
... dateline='1312462730'] 错误信息如下 gcc -Wl,--base-file,.libs/cygscws-1.dll-base -Wl,-e,__cygwin_dll_entry@12 -o .libs/cygscws-1.dll charset.lo crc32.lo pool.lo scws.lo xdict.lo darray.lo rule.lo lock.lo xdb.lo xtree.lo /usr/lib/gcc/i686-pc-cygwin/4.3.4/../../../libcygwin.a(libcmain.o):(...
...我确定我市完全按照你说的做的 php.ini 是这样的配置 [scws] extension=scws.so scws.default.charset=utf8 scws.default.fpath=/usr/local/scws/etc 而php 是这样 //分词 $so = scws_new(); $so->set_charset('utf8'); // 这里没有调用 set_dict 和 set_rule 系统...