...供调用。 [/quote] 感谢管理员回复. 其实我的意思大概可以简化为: 最长分词模式. 分出来的词要达到符合语法的最长.这个难度估计不小,呵呵,也可能是比较不现实的需求. 自己架设scws分词库程序当然可以导入自己的词库,但是...
如果只要文章中有Linux出现就算是Linux相关文章的话,其实是不需要分词了,直接用全文搜索Linux就好了。 只是SCWS目前看前来它的自定义词典不支持超过3个字,如果可以的话,可以通过自定义“Linux优化”来指定分词
...02974659'] xunsearch/bin/xapian-check xapian-inspect 这几个工具可以检查一下数据库,看看是不是坏了。 还有你可以试试用命令行的 util/Quest.php --db=db_a,db 这样强制指定DB库来测试一下呢? [/quote] 原來的數據已經全部被折騰壞了...
...您的索引数据库相当大,希望对索引库进行适当的分割,可以自命名新的索引库。 在搜索时可以使用 XSSearch::addDb 进行多库并行搜索。 一般情况下 一个库 多少数据为好呢? 我现在 480W数据 单库 搜索速度非常慢。大概是2-4秒...
...持 Yii 的扩展类。 ### 安装 和绝大多数 composer 一样,你可以通过以下两种方法中的任意一种安装。 可以直接运行 ``` composer require --prefer-dist hightman/xunsearch "*@beta" ``` 或者将以下内容添加到您的项目根目录 `composer.json` 中的 `re...
文档里只提到 “title 标题型,标题或名称字段,至多有一个该类型的字段”,可以理解为不用标题型的也是可以的吧
由于词库太大干扰所致,建议可以附加一个小词典(目的是删除这些无用词汇,以下我写出来作参考,把下面的文字存成dict.txt,然后在原有的set_dict之后加上 scws_add_dict(s, 'path/to/this_ad_dict.txt', SCWS_XDICT_TXT); 这样使文本词典生效. ...
...改的 php.ini 是不是正确的被使用了吧。 如果有命令行可以在命令行运行 php -m | grep scws 看看有没有能加载 如果都还不行,可以看看php的运行日志(如果有开启) [/quote] 谢谢 Hightman 问题已经解决 呵呵 第一次在linux使...
...会有问题吗?如果你这段字是用空格或逗号分隔,那么你可以用 split 这个分词器啊。 搜索的时候搜索任何一个分割后的TAG都可以搜索到。 [/quote] 呵呵,管理员没听明白楼主的意思,他希望xunsearch能提供分词接口,给其他...