搜索

大约有 213 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0068秒)

201.SCWS不支持英文和中英文混合分词吗?

更新时间:2010-08-24 20:08 t By fuhehe

...无效。 譬如: $so = scws_new(); $so->set_charset('utf8'); $so->set_dict('words.txt',SCWS_XDICT_TXT); $so->set_ignore(true); $so->send_text("GMhello指导员"); echo ''; while ($tmp = $so->get_result()) { var_dump($tmp); } $so->close(); 在words.txt只定义如下内容 GM 1.0 1.0 * hello指...

202.RE: 请问如何将没有的词添加到词库中去?Windows版的DLL有没有编译好的1.0.3的版本?

发布时间:2009-05-30 11:05 t By hightman

无法直接编辑xdb文件, 只能通过自带的 gen_dict 从文本文件转换词典, 目前尚未提供直接导出的工具(将来可能提供) windows版的php_Scws.dll因缺省编译环境和经验本人未能编译, 以前都是由网友bin友情编译... 如果您的词汇是属于通...

203.载入txt词典所出现的BUG

更新时间:2011-08-09 12:08 t By 999

... scws_set_charset($so, 'gbk'); scws_set_rule($so, 'rules.ini'); scws_set_dict($so, 'a.txt', SCWS_XDICT_TXT); scws_send_text($so, $txt); $result = scws_get_tops($so, strlen($txt)); print_r($result); [/php] 第一次运行的结果:([color=#FF0000][b]正常[/b][/color]) Array ( [...

204.scws-1.1.9 发布,明确采用 BSD 协议;改进复合分词修正BUG等

更新时间:2011-12-28 13:12 t By hightman

...合全文检索的需求 3) 测试脚本自动加载当前目录下的 dict_user.txt 文本词典 4) 修正 scws.c 中 __PARSE_XATTR__ 宏的 BUG 导致 scws_get_tops 和 scws_get_words 的 xattr 参数工作不正常的问题 5) 移除 scws.c 中关于 jabberd2s10 的注释,已不包...

205.请教为什么我这个无法分割成功啊?

发布时间:2011-07-05 20:07 t By cool

... $so = scws_new(); $so->set_charset('utf-8'); // 这里没有调用 set_dict 和 set_rule 系统会自动试调用 ini 中指定路径下的词典和规则文件 $so->send_text("我是一个中国人");; while ($tmp = $so->get_result()) { foreach($tmp as $k=>$v){ echo $v['word']."|"; } pri...

206.最新的主要变动

...13、scws-1.2.1 - 新增支持项目自定义词库,[参见文档](index.dict) - 改进网络 IO 读取,优化搜索内存运用等大幅提升性能和稳定性 - 净化服务端日志使记录更有价值 - 改进 util.Indexer 和 util.Quest 加入 --info 选项用于查看服务器简要情...

207.xunsearch-1.2.0 (基于xapian/scws/php的开源中文全文搜索,自定义词库、搜索日志管理)

发布时间:2011-12-12 17:12 t By hightman

...词汇才能生效。 [url]http://www.xunsearch.com/doc/php/guide/index.dict[/url] 3. 其它一些 PHP-SDK 工具和 API的修改: XSIndex 对象的各个方法也直接返回对象本身,以支持串接操作。 util.Quest 增加了 --show-query 功能用于查看解析后的内...

208.Libscws C API 使用说明

更新时间:2010-12-30 22:12 t By hightman

...ws_st 结构,不保证这类拷贝结果会有用。 typedef struct { xdict_t d; rule_t r; unsigned char *mblen; unsigned int mode; unsigned char *txt; int len; int off; scws_res_t res0; scws_res_t res1; word_t **wmap; struct scws_zchar *zmap; } scws_st, *scws_t; struct scws_...

209.xunsearch-1.4.0 (基于xapian+scws的开源中文搜索,大幅改进性能及稳定性)

发布时间:2013-01-22 12:01 t By hightman

...项目自定义词库,[url=http://www.xunsearch.com/doc/php/guide/index.dict]参见文档[/url] 3. 改进网络 IO 读取,优化搜索内存运用等大幅提升性能和稳定性 4. 净化服务端日志使记录更有价值 5. 改进 util.Indexer 和 util.Quest 加入 --info 选项用于查...

210.C版简易中文分词-cscwsd-0.0.3 发布

发布时间:2007-06-06 10:06 t By hightman

...scwsd -h 建议使用 cscwsd -D -L /tmp/cscwsd.log -d /usr/local/etc/dict.txt 3. 简单测试分词 telnet localhost 4700 然后直接输入文字即可,每敲入一个回车,服务器立刻返回当前句的切分结果. 几条控制命令,在切分前设定(可不设) /set...

  • 时间不限
  • 按相关性排序