基本用法都 不正确 ,看看手册吧 --source=csv --file=test.csv
1.修正夹杂在汉字中间的1-2个英文字符的词性为 en 而不是原来的 un 导致清除符号时消失. 2.调整将数字后面的独立 % 纳入整词作为百分比,如 33.3% 作为整词而不再是 33.3 和 % 3.修改连字符(-)和下划线(_)的规则,当出现在字母单词...
\n 才是换行。 \r 是回车。 解析词典是按换行标记来的。
还有一个建议,BBS中很多 \x1b (即 ascii=27 ESC键)的控制符,应该在建索引时给预过滤可能更好。 \033[1;31;44m 这样的格式,用正则过滤掉就好了。此外,我看到了你默认搜索的是 2年内,所以可能效果上采用了 value compare (addRange)的...
[quote='hightman' pid='755' dateline='1334719555'] 这个目前倒没有直接办法了,位置不能说明一切 [/quote] 我做了简单的修改。 添加了如下的规则: 如果对搜索词都是完全匹配,则出现在结果的列的最前面的给予最高权重。 如...
search.log 的生成是有一些规则判断和调整的,并不是如你所说的。自定义词典也会纳入考虑,但过于复杂的搜索语句是不会记录的。
[quote='hightman' pid='4506' dateline='1303195392'] 新版会开发一个API直接在函数里生成临时词库供调用。 [/quote] 感谢管理员回复. 其实我的意思大概可以简化为: 最长分词模式. 分出来的词要达到符合语法的最长.这个难度估计不小,呵呵...
请问hightman或群里的高人,php(utf8编码)PSCWS v4.0 是目前最新的版本吗? 官方说PSCWS v4.0这个版本速度较慢,但我的是utf-8编码,而且是虚拟主机,除了这个还能更好的版本可以使用吗? 求推荐和指点,谢谢了! [color=#006...
请问hightman或群里的高人,php(utf8编码)PSCWS v4.0 是目前最新的版本吗? 官方说PSCWS v4.0这个版本速度较慢,但我的是utf-8编码,而且是虚拟主机,除了这个还能更好的版本可以使用吗? 求推荐和指点,谢谢了! [color=#006...
[quote='hightman' pid='30' dateline='1316510603'] 参见代码如下,说明是$prefix/tmp 目录无法写入文件,检查一下目录是否存在,以及检查 indexd.log 看看里面的错误信息是什么。 752 sprintf(rcvfile, DEFAULT_TEMP_DIR "%s_%s.rcv", conn->user->name, db...