哦,那没有这样的功能,也提取不出这样的规则。建议在自己提取返回词时作判断和过滤吧。
...上就是这样子。 比如姓名识别:列出了常用的姓,然后判断后面跟上1,2个字,并且这些字不在排除范围内的(一般不会用到名字里的字)那么就视为一个人名。大前提是这些都是散字,不在词库里。
... 扩展 | OK | XSDocument, XSSearch | 用于字符串切割、判断 | | 编码转换 | mbstring | XSDocument, XSSearch | 用于支持非 UTF-8 字符集 | | 缓存模块 | WARNING | XS | 用于缓存项目配置文件的解析结果...
...切割,但不建议分割过多。 在索引数据入库时根据时间判断该对应哪个库名,比如用 db_1, db_2, ... 来区分 而在搜索的时候统一用 addDb 把所有的 db 都添加进支就可以了。 分后库对于旧库还可以调用 bin/xapian-compact 进行压缩、...
...。 因此我们在 XSIndex 的析构函数中增加了 endRebuild 的判断,如果有必要会自动结束重建来规避这个问题。 具体代码改法已提交进 GIT 代码仓库,预计下一版本包含这项改动。
...'alicar' pid='4034' dateline='1368603632'] cate:1,3,5 cate分词用逗号判断split(,) [/quote] 谢谢你提供的解决思路,我试了一下确实可行,但这种方法似乎并没有从根本上解决问题,如果我要查询的分类很多的话,比如30个,还是会报 Data/Nam...
...此为什么还要有 [XSIndex::add] 呢,因为添加文档少了一个判断 > 过程,具有更高一些的效率。因此,如果您在使用 `API` 时能明确知道当前文档是新增的,那么 > 还是建议使用 `add` 这个 `API`。 示范代码如下: ~~~ [php] $data = array( ...
... 扩展 | OK | XSDocument, XSSearch | 用于字符串切割、判断 | | 编码转换 | mbstring | XSDocument, XSSearch | 用于支持非 UTF-8 字符集 | | 缓存模块 | WARNING | XS | 用于缓存项目配置文件的解析结果...
search.log 的生成是有一些规则判断和调整的,并不是如你所说的。自定义词典也会纳入考虑,但过于复杂的搜索语句是不会记录的。
...大应当是"一件衣服" ,但这个只有1词个相同,所以程序就判断没有2个词相同的相关度大。 这个问题可能涉及到对语法的分析上,所以不知道你有没有好的相关度算法推荐下,谢谢!