...全部使用 *Unix* 系统下的标准C开发,全部采用自行设计的词典格式 (XTree 和 XDB) 完全不需要依赖任何第三方库及数据库系统。统一编译成链接库 (.a或.so形式),在开发和使用上都比较方便。而在 php 这块,做法是将它移植做成 P...
...ring 连接字符串 XSServer customDict string 获取自定义词典内容 XSIndex project string 获取当前项目名称 XSServer respond XSCommand 从服务器读取响应指令 XSServer scwsMulti int 获取当前索引库的分词复合等级 XSIndex ...
...] 完成,主要目的是用于类似黑词判断。 您可以自制一个词典,并将黑词统一设置为一个独特的属性,比如 "@", 那么就可以用该功能判断一段文本是否包含黑词。 ~~~ [php] $text = '...'; if ($tokenizer->hasWord($text, '@')) { // 包含词性...
... set_dict 和 set_rule 系统会自动试调用 ini 中指定路径下的词典和规则文件 $so->add_dict(ini_get("scws.default.fpath") . '/dict.utf8.xdb'); $so->add_dict("/usr/myapp/dict_extra.txt",SCWS_XDICT_TXT); $so->set_rule(ini_get('scws.default.fpath') . '/rules.utf8.ini'); // $so...
...de/util.logger[/url] 2. 小修改大提升,支持自定义 SCWS 分词词典,文本格式。但旧有索引必须重建,新增的词汇才能生效。 [url]http://www.xunsearch.com/doc/php/guide/index.dict[/url] 3. 其它一些 PHP-SDK 工具和 API的修改: XSIndex 对象的各...
...ld\dede\getwen.php on line 5 不加呢,又会分词不成功,貌似是词典的问题,能不能告诉我哪里做错了呢? 忘记说了,我用的编码都是utf8 还有就是如果我用 $so->set_dict('C:/Program Files/scws/etc/dict.xdb'); $so->set_rule('C:/Program Files/scws/etc/rul...
...更好功能更强 5. 修改 XSTokenizerScws 以支持项目级自定义词典的 6. 自定义分词器的字段也能参与权重计算了,在 ini 指定 `non_bool = yes` 7. 采用 bootstrap 框架美化 util.SearchSkel 生成页面效果 官方网站:[url]http://www.xunsearch.com[/url] ...
...3) libscws 增加 scws_fork() 从既有的 scws 实例产生分支并共享词典/规则集,主要用于多线程开发。 4) 新增部分版本的 win32 的 dll 扩展,详见下载页面 [b]scws-1.1.9 发布于 2011-12-26[/b] 2011-12-26: SCWS-1.1.9 Released. 1) 明确使用开源协议 Ne...