可以添加对词性的判断,以及词性的权重比,应该可以达到你想要的效果~ 例如:在SCWS分析以上三句词性得到: 你/r 给/v 我/r 买/v 的/uj 衣服/n 你/r 看/v 的/uj 书/n 一/m 件/q 衣服/n 以此可以看出,其中匹配的是 你/r 的/uj 衣服/n ...
1. un 是 unknown, 如果需要你可以自己添加一个”LG集团“的词,这样它会被当作一个整词。 通常 un 是指不存在于词库中的字词,对于你这个情况,你可以修改 libscws/scws.c 第 680 行把 attr_un 改为 attr_en 即可,如果需要严格一点可...
...! 我刚试了下,针对我的需求来说,对于人物英文名以3个字母为单位建立索引的确可以达到很好的效果,中文名以一个汉字为单位。 最后贴出我的代码给有需要的人: [php] class XSTokenizerUnary implements XSTokenizer { private $l...
...ue;} 取得命令行参数 要求事先调用 parseOpt, 否则会自动以默认参数调用它。 参见 parseOpt parseOpt() 方法 public static array parseOpt(array $valued=array ( )) $valued array 需要附加值的参数列表 {return} array 解析完的参数...
...在同一主键的其它数据 {return} XSIndex 返回自身对象以支持串接操作 源码: sdk/php/lib/XSIndex.class.php#L85 (显示) public function update(XSDocument $doc, $add = false){ // before submit if ($doc->beforeSubmit($this) === false) { return $this; } ...
... $doc) $doc XSDocument {return} XSIndex 返回自身对象以支持串接操作 源码: sdk/php/lib/XSIndex.class.php#L72 (显示) public function add(XSDocument $doc){ return $this->update($doc, true);} 添加文档到索引中 特别要注意的是: 系统不会自动...
...ize 确认一下扩展编译步骤(在 scws-1.1.5/phpext/ 目录下运行以下): /usr/local/php/bin/phpize --clean /usr/local/php/bin/phpize ./configure --with-php-config=/usr/local/bin/php-config make make install 这时 .so 可能会安装到默认的 /usr/local/php/lib/extensions/no-debu...
...修正后的搜索词列表 通常当某次检索结果数量偏少时, 可以用该函数设计 "你是不是要找: ..." 功能 dbTotal 属性 只读 public int getDbTotal() 获取搜索数据库内的数据总量 facets 属性 (自版本 v1.1.0 起可用) public array getFacets(s...
...XS = $this;} 构造函数 特别说明一个小技巧, 参数 $file 可以直接是配置文件的内容, 还可以是仅仅是文件名, 如果只是文件名会自动查找 XS_LIB_ROOT/../app/$file.ini __destruct() 方法 public void __destruct() 源码: sdk/php/lib/XS.class.php#...
...库采用的是自行设计的xdb 和 xtree 结构,故本库函数也可以用以 XDB 和 XTree 数据存取(另行介绍)。 [size=3][color=blue][b]1. 数据类型[/b][/color][/size] (仅列出API中需要关注的部分) ·[b]scws 操作句柄[/b],几乎所有的 API 函数都使用...