建议看这里:[url]http://www.xunsearch.com/doc/php/guide/start.demo[/url]
单字标为 @ 是以前遗留下来的, 未确定词性, 还有一部分被标为 un 了, 建议把 un 改为 '@' ,否则可能导致散字自动聚合成2元分词时会不聚合.
我在64,32位机器都测试过。从你的出错提示看,报错文件是属于 php 安装后的头文件。。。 建议都是由源码方式编译安装 php
...度(5-10个汉字)添加到日志 日志来说 相关搜索和搜索建议 搜索词修正要用到 有开关功能会比较好些 默认添加就好 也不会影响现有的功能
...下来进行分析,并保存在日志中用于统计热门搜索、搜索建议、相关搜索等。 默认情况系统会每 2 小时进行一次更新日志,由于我们在进行测试,所以请使用以下指令进行强制刷新。 ~~~ util/Indexer.php --flush-log demo ~~~ 接下来我...
...mode 看需要吧,只是一个整型 ,如果你在不同线程中切分建议各自用一个 mode ,除非你自己能确定它们的切词设置是共用的(主要用于保存切词中那些是否忽略符号,是否复合分词等的设置)
...-的-卡" 感谢!!![hr] 我找到了楼主原先的一个回复: 建议把这些要过滤的词新增加文本词典,属性设为 ! 即可。或者自己根据词性直接在取得返回值的时候排除它。。 尝试了下,是可以的!!!多谢
区间+排序就会不准。有关贴子已经细说过了,概率统计的原因。 建议用无排序的方式先调用 XSSearch::count 进行统计