...库文件如下: ~~~ $prefix/data/项目名称/dict_user.txt ~~~ 文件内容及格式与[全局自定义词库](#ch0)是一致的,在此不再赘述。此外,这个文件还可以通过相关的 SDK API 读取和修改。 - [XSIndex::getCustomDict] 读取当前项目的自定义词库内...
...字段没有任何词汇用于索引 split([ ]) 表示根据参数分割内容,默认参数为空格,若参数以 / 开头并以 / 结尾则 内部调用 preg_split(arg, ..) 来分割取词,以支持正则或其它特殊字符分割 xlen([2]) 表示根据指定参数长度分段取词,...
...型,标题或名称字段,至多有一个该类型的字段 - body 内容型,主内容字段, 即本搜索项目中内容最长的字段,至多只有一个该类型字段,本字段不支持字段检索 ~~~ type = string ~~~ #### index 索引方式 xunsearch 的索引有...
...sh_ 强制提交搜索日志变动 * _--clean_ 清空搜索日志全部内容 经典用法示例 ----------- 以下是一些常见用法举例: ~~~ # 查看 demo 项目中 热门搜索词 util/Logger.php demo util/Logger.php demo --hot=cur # 查询 demo 项目中 "word" 相关搜索词汇...
...->get_words("*"); 则可以获取黑词清单,显式地告诉用户它的内容包含了哪些非法词汇。。。 [/quote][hr] 你好,请问你。utf8 的词库为什么用不上啊。还有 gbk 词库 和 utf8 的容量区别也很大。有没有跟gbk 编码的一样 utf8词库呢?
...->get_words("*"); 则可以获取黑词清单,显式地告诉用户它的内容包含了哪些非法词汇。。。 [/quote][hr] 你好,请问你。utf8 的词库为什么用不上啊。还有 gbk 词库 和 utf8 的容量区别也很大。有没有跟gbk 编码的一样 utf8词库呢? [/qu...
...andle 即之前由 scws_open 打开返回的; text 是文本的内容。 注1:系统底层处理方式为对该文本增加一个引用,故不论多长的文本并不会造成内存浪费; 注2:执行本函数时,若未加载任何词典和规则集,则会自动试图在ini...
...建议执行 util/RequireCheck.php 以检查环境。 具体各项文档内容请参阅子目录: doc/ 强烈推荐在线阅读我们的文档: 最简单使用方法就是下载全部源码压缩包,然后引入入口文件即可。 出现异常则抛出 \XSException 异常实例。 Compo...
...于 2011-05-21[/b] 1) 删除 __PARSE_XATTR__ 宏中企图修改 xattr 的内容的作法, 当 xattr 为常量字符串时会出错. 2) 调整 config.h 的包含方式移入 .c 文件而非 .h 文件 3) 增加一些PHP测试脚本, 位于phpext/scws_test.php, 精选了一些岐义较多的语句...
...] [b]描述:[/b]释放由 scws_new() 返回的 scws 操作句柄及对象内容,同时也会释放已经加载的词典和规则。 [b]返回值:[/b]无 [b]错误:[/b]无 [b][color=#ff6600][/color][/b] [b][color=#ff6600]·void scws_set_charset(scws_t s, const char *cs);[/color][/b] [b]描述...