搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

61.RE: mysql 其实支持中文全文检索的

更新时间：2010-05-16 22:05 t By hightman

用scws的MYSQL插件就不需要另外存一份了，而且操作也简便，对表设计和操作不需要做任何额外的处理。其它差别不大吧

62.为什么第四版速度这么慢?

发布时间：2011-02-08 19:02 t By hit

我电脑APACHE+PHP 4GB内存 E6300处理器 PHP简易中文分词(SCWS) 第4版(GBK) 在我电脑上用你默认的分词内容"陈凯歌并不是..." 第一次0.8xxxs 第二次0.098711013793945 而你们演示的就快多了 0.0039410591125488 为什么差距这么大?

63.RE: 「清除标点符号断词」错误回报

发布时间：2010-05-16 22:05 t By hightman

清除符号本质上是根据词性来处理的。勾上词性后发现这些被清除的词性都是 un 所以会被清除，这是因为词典的数据不对导致的，之前的繁体词典是一位朋友帮忙整理的，可能有所缺漏和不对。

64.RE: 中文分组粗分方法

发布时间：2010-05-27 11:05 t By hightman

...html 并没有很固定的算法，SCWS中的tf/idf均经过特殊加工处理了

65.RE: XSTokenizerScws的一个使用问题

发布时间：2013-01-30 14:01 t By hightman

...将其合成为一个词。复合分词是对原本是词的长词情况处理的，比如”中国“可以切成”中“＋”国“＋”中国“ 你的问题必须是 [code] $tk = $tokenizer->setDuality(false)->setIgnore(true)->setMulti(11)->getResult("是一"); [/code]