2010-12-31: SCWS-1.1.5 Released. 1) 修正 xdb.c 中存在的一处缓冲区溢出, 感谢论坛网友 hovea. 2) 修正 phpext/ 中 scws_get_result() 参数解析里多了一个z 的问题,感谢网友(阿男)告知 3) 修正 scws.c 中某些字符在ignore symbol设置下无效的问...
...越经常出现的越高) IDF是逆词频率,也就是说这个词更重要(因为罕见一些);具体参见:http://baike.baidu.com/view/1228847.html 并没有很固定的算法,SCWS中的tf/idf均经过特殊加工处理了
...刚安装好了,用了很舒服。但有些分好的词都带有某些不重要的字。 如“我的秘密花园”里面的‘我’,‘的’我是都想去掉的。看了你的回帖,但是摸不着头脑是如何通过透过scws_get_result()取数据时自行排除... 还请站长...
...功 第二部分:建立索引、搜索 hdwiki用的mysql,其中最重要的表是wiki_doc。 1,建立go.ini文件 每一个 xunsearch 搜索项目都有一个独立的 INI 配置文件。go.ini项目的配置文件位于 /usr/local/xunsearch/sdk/php/app/go.ini 内容如下: [code]pr...
...秘密的人。共同学习才能共同提高,取长补短,分词是很重要的中文信息分析基础技术,中国的信息化建设要达到国际水平,分词技术一定不可以少的,一定要有很多的具有奉献精神的有志之士共同努力,hightman就是我学习的榜...