...它搜索前设置正确的字符集。 典型搜索做法 ----------- 一个典型的搜索基本流程是把构建好的搜索语句,通过合适的 `API` 进行必要的修饰, 再传递给底层的搜索服务器进行处理,然后把匹配的结果返回。具体包括以下步骤: ...
编写第一个配置文件 `Xunsearch` 的配置文件是纯文本的 `INI` 格式,用任何文本编辑器均可编写,在 `Unix` 类型的系统下推荐 用 `vi`,而 `Windows` 下可以用记事本或 `EditPlus` 进行编写。我们也正在计划不久的将来制作一...
...zend_parse_parameters() -- [b]scws-1.1.2 发布于 2010-5-9[/b] 这是一个小bug修正版,修正在非内存模式词库时会导致人名识别失败的bug. -- [b]scws-1.1.1 发布于 2010-3-4[/b] 这是一个bug修正版,1.1.0 中存在内存泄露的重大bug。 -- [b]scws-1.1.0...
...索语句的分词复合等级 复合等级是 scws 分词粒度控制的一个重要参数, 是长词细分处理依据, 默认为 3, 值范围 0~15 注意: 这个设置仅直对本次搜索有效, 仅对设置之后的 setQuery 起作用, 由于 query 设计的方式问题, 目前无法支持搜...
...bject); $docs = $search->search(); 貌似有个问题,就是关键词是一个词的时候搜索出来正常的,关键词是2个或者2个以上的时候,就报错。 另外,那个getTops方法中的第二个参数啥意思?手册上没写明白。词性除了n和ns还有哪些啊?全...
...zend_parse_parameters() -- [b]scws-1.1.2 发布于 2010-5-9[/b] 这是一个小bug修正版,修正在非内存模式词库时会导致人名识别失败的bug. -- [b]scws-1.1.1 发布于 2010-3-4[/b] 这是一个bug修正版,1.1.0 中存在内存泄露的重大bug。 -- [b]scws-1.1.0...
...网友 hovea. 修正 phpext/ 中 scws_get_result() 参数解析里多了一个z 的问题,感谢网友(阿男)告知 修正 scws.c 中某些字符在ignore symbol设置下无效的问题 -- [b]scws-1.1.3 发布于 2010-09-15 [/b] 将 cli/ 下的工具程序命名下划线改成连...
...等场合运用。 切词效率测试(UTF-8编码,随机从天涯抓取了一个连载页面测试结果, 45Kb左右的文本切词时间是0.026秒, 换算完毕大概是 1.5MB文本/秒) 测试过程中开启了散字自动二元聚合, 长词自动补切为短词, 开启了人名地名数字智...
...自定义词库。 全局自定义词库 ------------- 这是针对同一个 `xunsearch` 安装实例来讲,该服务端下的所有项目都将共用这个自定义词库。 严格来讲,这是 SCWS 本身就提供的功能,xunsearch 只是做了整合和规范。涉及的相关文件如...
...询的方式都较另外二者灵活. 在今天做测试时, 有遇到一个关于复合分词问题, 类似于"官方網站"这样的词汇, 默认配置下是作为单一词划出, 于是搜索"網站"时不可见. 如果设定-M 为 3 (0011) 可以解决这个问题, 但是在xunsearch中未...