...无效。 譬如: $so = scws_new(); $so->set_charset('utf8'); $so->set_dict('words.txt',SCWS_XDICT_TXT); $so->set_ignore(true); $so->send_text("GMhello指导员"); echo ''; while ($tmp = $so->get_result()) { var_dump($tmp); } $so->close(); 在words.txt只定义如下内容 GM 1.0 1.0 * hello指...
无法直接编辑xdb文件, 只能通过自带的 gen_dict 从文本文件转换词典, 目前尚未提供直接导出的工具(将来可能提供) windows版的php_Scws.dll因缺省编译环境和经验本人未能编译, 以前都是由网友bin友情编译... 如果您的词汇是属于通...
... scws_set_charset($so, 'gbk'); scws_set_rule($so, 'rules.ini'); scws_set_dict($so, 'a.txt', SCWS_XDICT_TXT); scws_send_text($so, $txt); $result = scws_get_tops($so, strlen($txt)); print_r($result); [/php] 第一次运行的结果:([color=#FF0000][b]正常[/b][/color]) Array ( [...
...合全文检索的需求 3) 测试脚本自动加载当前目录下的 dict_user.txt 文本词典 4) 修正 scws.c 中 __PARSE_XATTR__ 宏的 BUG 导致 scws_get_tops 和 scws_get_words 的 xattr 参数工作不正常的问题 5) 移除 scws.c 中关于 jabberd2s10 的注释,已不包...
... $so = scws_new(); $so->set_charset('utf-8'); // 这里没有调用 set_dict 和 set_rule 系统会自动试调用 ini 中指定路径下的词典和规则文件 $so->send_text("我是一个中国人");; while ($tmp = $so->get_result()) { foreach($tmp as $k=>$v){ echo $v['word']."|"; } pri...
...13、scws-1.2.1 - 新增支持项目自定义词库,[参见文档](index.dict) - 改进网络 IO 读取,优化搜索内存运用等大幅提升性能和稳定性 - 净化服务端日志使记录更有价值 - 改进 util.Indexer 和 util.Quest 加入 --info 选项用于查看服务器简要情...
...词汇才能生效。 [url]http://www.xunsearch.com/doc/php/guide/index.dict[/url] 3. 其它一些 PHP-SDK 工具和 API的修改: XSIndex 对象的各个方法也直接返回对象本身,以支持串接操作。 util.Quest 增加了 --show-query 功能用于查看解析后的内...
...ws_st 结构,不保证这类拷贝结果会有用。 typedef struct { xdict_t d; rule_t r; unsigned char *mblen; unsigned int mode; unsigned char *txt; int len; int off; scws_res_t res0; scws_res_t res1; word_t **wmap; struct scws_zchar *zmap; } scws_st, *scws_t; struct scws_...
...项目自定义词库,[url=http://www.xunsearch.com/doc/php/guide/index.dict]参见文档[/url] 3. 改进网络 IO 读取,优化搜索内存运用等大幅提升性能和稳定性 4. 净化服务端日志使记录更有价值 5. 改进 util.Indexer 和 util.Quest 加入 --info 选项用于查...
...scwsd -h 建议使用 cscwsd -D -L /tmp/cscwsd.log -d /usr/local/etc/dict.txt 3. 简单测试分词 telnet localhost 4700 然后直接输入文字即可,每敲入一个回车,服务器立刻返回当前句的切分结果. 几条控制命令,在切分前设定(可不设) /set...