實在感謝您如此迅速, 熱心的回應. 依您回應, 補添加上 + /// hightman.090716: for PHP5.3+ + #if (PHP_MAJOR_VERSION == 5 && PHP_MINOR_VERSION >= 3) || (PHP_MAJOR_VERSION >= 6) + #undef ZVAL_REFCOUNT + #undef ZVAL_ADDREF + #undef ZVAL_DELREF + #define ZVAL_REFCOUNT Z_REFC...
...中文复合词的查询分析器,升级整合最新的 xapian-1.2.8、scws-1.1.9 2. 新增自动同义词搜索功能,详见同义词专题文档 [url]http://www.xunsearch.com/doc/php/guide/special.synonym[/url] 3. 调优服务端参数,大幅度提升并发处理能力(3~5倍),...
...。 主要更新如下: 1. 升级整合最新的 xapian-1.2.13、scws-1.2.1 2. 新增支持项目自定义词库,[url=http://www.xunsearch.com/doc/php/guide/index.dict]参见文档[/url] 3. 改进网络 IO 读取,优化搜索内存运用等大幅提升性能和稳定性 4. 净化服...
[s]呵呵,观察了一天,“document xxxx not found”的问题看不到了[/s] 额,不是,还是有这个错误在log中:(
2007年最新的 SCWS 第4版已于近日开发完成并测试运行中。它在算法与写法上都有相当大的改进,支持自定义规则的人名等专名自动识别,也支持UTF-8/GBK等不同字符集。经评估测试分词准确率在 95% 左右,召回率有 92% 以上。 这...
mmbb:/usr/src/scws-0.0.1-pre/src# valgrind --tool=memcheck --leak-check=yes ./scwsc -r ../etc/rules.ini -d ../etc/dict.xdb -i "有用过NTFS的朋友抱怨" ==30624== Memcheck, a memory error detector. ==30624== Copyright (C) 2002-2006, and GNU GPL'd, by Julian Seward et al. ==30624== Using LibVE...
比如说“这本书”,在用C语言编译调用scws分词结果为"这/本书",但是编译为php扩展后调用,结果为"这本书",没有分掉,同一份代码同一个词库同一个规则集,为什么会出现不一样的结果?
[quote='hightman' pid='8876' dateline='1333164684'] txt词库其实也是转换成XDB再调用的,不用担心性能。 你合并词典很简单啊,把 dict.utf8.xdb 导出来嘛 [/quote] 谢谢hm。还是更加期望加上直接入字典库的功能。这样更加方便,就是不知...
...(这是1.1.0起新加的功能,所以1.0.x的版本无此bug) #define SCWS_WORD_MALLOCED 0x100 只要将 0x100 改变 0x80 即可,因为 struct scws_word 中定义的 flag 为 unsigned char 即 8bit, 容不下 0x100 导致,所有的 ->flag |= SCWS_WORD_MALLOCED 失效,以至于在 scws.c ...
...下份,并重启了服务。 我现在的问题是想通过XSTokenizerScws来获取指定文本的自定义分词结果。sdk使用了github里最新的版本,词典格式由一楼所示,现在取出来的结果并不包含任何自定义词典的关键词,求解。[/code] [php] $te...