全文检索的单位通常是“词”。通常认为,一个普通的字没有意义。 实在有必要你可以自定义分词器,按字索引。
...考虑: 1.xunsearch原理上是实现了别的数据库无法实现的全文检索功能,数据要靠定期加入或者清理,实际类似缓存系统。 2.靠操作去删除,因为操作起来频率不确定,对整个库的性能有影响,而靠系统去清理效率最高,而且稳...
...以出结果 怎么回事? [/quote] 出不来才是对的啊,这是全文检索不是 LIKE '12%' [/quote] 我用的是工具生成的搜索骨架!
...//so.lrcgc.com]http://so.lrcgc.com[/url],可通过歌词搜歌名。mysql全文搜索对中文支持太弱,xunsearch又提供了非常方便、简洁的接口,目前测试结果比较理想。 补充:当前总数据量15万条,数据库不到300M,每天增长中。
...什么,好像助词'的'、标点符号等都被视为un。我在插入全文索引记录的时候,需要排除此类,但又会把像"LG集团"这样的例子给漏掉。 2, 百分数会将数字与百分号分离,如5.7% 会分为 5.7+%,我希望的结果是将他们合为一体。有没...
如果只要文章中有Linux出现就算是Linux相关文章的话,其实是不需要分词了,直接用全文搜索Linux就好了。 只是SCWS目前看前来它的自定义词典不支持超过3个字,如果可以的话,可以通过自定义“Linux优化”来指定分词