还有就是内存的问题,因为我希望在服务器端有个自动生成词库的功能,命令行方式不是很方便。 主要是用机器先自动分词,人工发现不合理,再把新词增加进去。
...dateline='1280386250'] 其实你可以定时或某种其它方案把你的词库统一生成.XDB文件呀 [/quote] 这样做确实是可以,只是这时候文件就只是一个联系数据库和scws的一个中介,一个很临时的东西。我的意思是想可不可以绕过它。
...,用于生成文章的tag,我自己给定了一个用户自定义词库,在$tokenizer->getTops()时,不能找出我想要的语词,$tokenizer->getResult能获取到所有分词的结果,不知道这个问题的原因是怎么产生的。请指点一下。 以下是我的字典定...
...级整合最新的 xapian-1.2.13、scws-1.2.1 - 新增支持项目自定义词库,[参见文档](index.dict) - 改进网络 IO 读取,优化搜索内存运用等大幅提升性能和稳定性 - 净化服务端日志使记录更有价值 - 改进 util.Indexer 和 util.Quest 加入 --info 选项...
...试 * _--synonym_ 启用自动同义词搜索,这依赖于您的同义词库设置 经典用法示例 ----------- 以下是一些经典用法举例: ~~~ # 搜索 demo 中包含 "测试" 的数据 util/Quest.php demo 测试 # 搜索 demo 中包含 "测试" 的数据,并限制最多返回...
...含 `finding` 或 `finds` 等同根词的结果。 存取项目自定义词库 ----------------- 您也可以通过命令行查看和修改项目的自定义词库,具体用法如下: ~~~ # 查看 demo 项目的自定义词库 util/Indexer.php demo --custom-dict # 将已有自定义词库...