...都不理解,问下你使用的分词方法是基于词典的哪种?能不能给我阐述下,技术的思想呢? 我的要求比较强求,毕竟是设计您软件的核心内容。我不是抱着去盈利或者其他什么理由来学这个。 欢迎您给我发Email:nextyu.wang AT gma...
... * from cdb_posts limit 999999999999 offset 5000000" 类似这样,OFFSET 不能单用必须配合 limit [/quote] 呵呵 原来如此 非常感谢,数据已经导入了500万左右,做了测试,真是相当快,最慢的也就1秒就有结果了,顶起~~
'REQUEST_URI'是地址栏地址 你说的来路是referer[hr] 但是直接输入网址或收藏夹访问,也是来路为空的。 你不能排除有人直接把搜索结果页收藏起来吧?
是直接运行php文件导出词典,还是在cmd下进行操作?能不能搞个简单点的词典导出导入,或者直接给未加密的词典文件
...件并附带一些例子 [/quote] 问题是如果是扫描程序,并不能做到实时啊![hr] [quote='caixun2002' pid='709' dateline='1333593500'] [quote='hightman' pid='705' dateline='1333591381'] 自己做个扫描程序,以文件名为key,内容为body建索引不就好了? xu...
...起首次搜索时间特别长 是默认排序的2-3倍时间 我想能不能API加入一些特征 进行快速的过滤 比如前2000条结果外的就不统计了[hr] 仔细想下 这个需求意义不大 200万个搜索结果的情况下 怎么排序都意义不大 所牵涉的样本比例太...
...自定义词呢? 1、在dict_user.txt 里添加了自定义词,系统不能提取到上面2个词 2、在 /etc/rules.utf8.ini里添加专业的词,我在 [special] 下添加了上述2个词,结果还是没能提取到 麻烦了,在此先行谢过了!
...'755' dateline='1334719555'] 这个目前倒没有直接办法了,位置不能说明一切 [/quote] 我做了简单的修改。 添加了如下的规则: 如果对搜索词都是完全匹配,则出现在结果的列的最前面的给予最高权重。 如果有多个结果同...
有个问题,在演示地址中,统计词性: 需要屏蔽 ~vn,~nr时, 仅第一个有效,不能设置多个
... util/Quest.php demo "subject:小弟 OR pid:49" 这样也不行。 能不能,给个示例说一下,怎么弄。 项目配置文件做了修改,需要从新生成测试代码吗?