2010-12-31: SCWS-1.1.5 Released. 1) 修正 xdb.c 中存在的一处缓冲区溢出, 感谢论坛网友 hovea. 2) 修正 phpext/ 中 scws_get_result() 参数解析里多了一个z 的问题,感谢网友(阿男)告知 3) 修正 scws.c 中某些字符在ignore symbol设置下无效的问...
...'; $words = $tokenizer->getResult($text); print_r($words); ~~~ ### 提取重要词汇 调用 [XSToenizerScws::getTops] 可以简单提取重要词汇,它支持三个参数, 返回的词汇数组元素和分词结果类似,只是把 *off* 替换为 *times* 表示这个词在文本中出现...
...发方式。 本章节将简单介绍开发过程中要接触到的几个重要对象(类)。 * [XS] 搜索项目的总对象,所有操作均基于此对象或其属性。 * [XSException] 所有操作中出现的异常、错误均抛出此类型的异常,搜索代码中应该尝试捕捉该...
...越经常出现的越高) IDF是逆词频率,也就是说这个词更重要(因为罕见一些);具体参见:http://baike.baidu.com/view/1228847.html 并没有很固定的算法,SCWS中的tf/idf均经过特殊加工处理了
...具 在 `Xunsearch` 中项目的 `INI` 配置文件至关重要,内容本身明文可以直接查看、 可以直接修改。但其中还是有一些约定的规则和限制,为了更方便用户,我们打算提供 这样的工具辅助用户创建、修改配置文件。 IN...