可以添加对词性的判断,以及词性的权重比,应该可以达到你想要的效果~ 例如:在SCWS分析以上三句词性得到: 你/r 给/v 我/r 买/v 的/uj 衣服/n 你/r 看/v 的/uj 书/n 一/m 件/q 衣服/n 以此可以看出,其中匹配的是 你/r 的/uj 衣服/n ...
1. un 是 unknown, 如果需要你可以自己添加一个”LG集团“的词,这样它会被当作一个整词。 通常 un 是指不存在于词库中的字词,对于你这个情况,你可以修改 libscws/scws.c 第 680 行把 attr_un 改为 attr_en 即可,如果需要严格一点可...
...! 我刚试了下,针对我的需求来说,对于人物英文名以3个字母为单位建立索引的确可以达到很好的效果,中文名以一个汉字为单位。 最后贴出我的代码给有需要的人: [php] class XSTokenizerUnary implements XSTokenizer { private $l...
...ize 确认一下扩展编译步骤(在 scws-1.1.5/phpext/ 目录下运行以下): /usr/local/php/bin/phpize --clean /usr/local/php/bin/phpize ./configure --with-php-config=/usr/local/bin/php-config make make install 这时 .so 可能会安装到默认的 /usr/local/php/lib/extensions/no-debu...
...库采用的是自行设计的xdb 和 xtree 结构,故本库函数也可以用以 XDB 和 XTree 数据存取(另行介绍)。 [size=3][color=blue][b]1. 数据类型[/b][/color][/size] (仅列出API中需要关注的部分) ·[b]scws 操作句柄[/b],几乎所有的 API 函数都使用...