中国国民党荣誉主席连战及随访 结果分词就把“连战及”分到一起了。 请问有解决办法嘛? 似乎两个字的名字,容易和后面的字分到一起。 我在论坛中看到了“武松杀”的帖子,但是貌似没有解决办法? 谢谢。
谢谢马老师 [ 应该是吧:-)]的及时回复。 我在研读代码的时候,看到有段代码注释着,是对半字的处理,并不是很理解,对于文字都是1-4字节的UTF-8存储编码。 半字是种什么情况呢?
在提供的文档中,几乎没有发现对rules.ini如何使用的介绍。是否有相关的文档能介绍一下呢? 例如我在ini中看到areaname的配置,这个配置是起什么作用呢?不解。盼高人解疑,谢谢!
前台数据用xunsearch就好,只索引发布的内容(普通浏览者可以看到的)。 管理后台搜索的话,还是用mysql like吧。 如果非要这么做那就多看下这个文档: http://xunsearch.com/doc/php/guide/search.query
学习中看到,程序对于英文字串的处理时,定义TF的值为 = 2.5×log(#wlen),词长的自然对数的2.5倍。有什么实际意义么? 为什么是这个值呢?
从提示看是权限问题,你的 $prefix/data 目录不存在或不可写入?(相对于启动 xs-indexd, xs-searchd 的用户) ps auxw | grep xs- 可以看到启动用户
...用的搜索骨架代码,即使您不做任何修改,也能使用它并看到 基础的搜索效果、界面。强烈建议所有的搜索项目都在生成的骨架代码上进行二次开发,节省大量宝贵时间。 运行脚本工具的 --help 选项可查看内置的帮助和说明,...
非常棒啊~期望能尽早看到开放~~ (PS:顺便求内测包~)[hr] 测试了一下,感觉可以加上一些统计的功能就更好了.比如chart方式展示搜索量啊,搜索热门度之类的数据~