要命了,管理员请指点: linux命令行执行: scws 北京大学 -c utf8 -d /usr/local/scws/etc/dict.utf8.xdb -M 3 返回: 北京大学 北京 大学 php调用system执行同样的命令,返回4个单字。
最近在搞分词相关的毕业设计 是C++开发的 想用大神的SCWS 把LIBSCWS编译成DLL来供我自己的程序调用 但是在WINDOWS下编译老是过不了 给的VC++6的项目也编译不成功,希望大神能指教下怎么在windows下编译
最近在搞分词相关的毕业设计 是C++开发的 想用大神的SCWS 把LIBSCWS编译成DLL来供我自己的程序调用 但是在WINDOWS下编译老是过不了 给的VC++6的项目也编译不成功,希望大神能指教下怎么在windows下编译
比如“北京er朝阳” 能分出北京和朝阳 变成”北京erty朝阳“,中间有2个以上的半角字符就不行了,只能分出北京,分词终止。 这个是什么原因 用的是php_scws.dll vc9
可否说一下是怎么调试的,第2个方式可能是编译器优先级的问题? 希望可以准确复现 php_scws.dll 在WIN32平台下加载TXT会出现问题吗?
下载 php-5.2.x: http://www.ftphp.com/scws/down/scws_1.1.1_win32_php-5.2.x.zip 然后将解压后的php_scws.dll 放到 D:\wamp\bin\php\php5.2.6\ext(我用的环境是集成环境wamp) 下面这些我也都照做了。 建立一个本地目录放规则集文件和词典文件,建议使用...
原先使用windows版本,现迁移到ubuntu 64位系统,下载安装了最新版scws,安装过程还算顺利。 测试时发现以下怪现象: 本人使用15000个左右的学校名称做分词测试,约1400条记录返回空白,其它则貌似正常,不知何故。 比如:北...
专门测试了一下,去掉set_ignore, 输入“北京大学”有返回了,“北”,“京”,“大”,“学”, 输入“清华大学”,返回“清”,“华大学”,“华大”,“大学”。 总之,原先有set_ignore时无返回的,现在全部拆成了一个...
我在WINDOWS XP + APACHE + PHP5环境加载正常,但在WINDOWS 2003 + IIS 6.0 + PHP5(这个配置环境正常,可以顺利运行其他PHP代码,执行MYSQL操作)却无法正常加载 我在输入php -m的时候见不到scws的踪影,因正式工作环境是后者,所以想像开...