搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

131.求TF/IDF算法（官方的计算器没有作用）

发布时间：2013-05-22 13:05 t By zouhc

...果计算出来的大部分内容都是一样的值，而且也无法用于分词。另外用这个计算器计算得到的TF和IDF值和词典中原先的不一样。如：词典中的词语“辣椒油”在词典中是这样的：辣椒油 13.45 9.22 n 我用计算器得出是这样...

132.求TF/IDF算法（官方的计算器没有作用）

发布时间：2013-05-22 13:05 t By zouhc

...果计算出来的大部分内容都是一样的值，而且也无法用于分词。另外用这个计算器计算得到的TF和IDF值和词典中原先的不一样。如：词典中的词语“辣椒油”在词典中是这样的：辣椒油 13.45 9.22 n 我用计算器得出是这样...

133.scws 1.1.2 php extension安装的问题

发布时间：2010-06-12 17:06 t By vinwuser

...ws，我用php 的 dl() 函数测试是否可以调用。这个可以，但分词结果不对，猜测是词库调用的原因，但我把xdb放到php同目录下或者调用/usr/local/scws/etc/下的词库，都得到scws_set_dict(): supplied argument is not a valid scws handler resource。这是...

134.仍然是第一个例子的问题，怎么连“中国人”都没分出来？

发布时间：2013-04-14 15:04 t By zctr

...文件存为ANSI形式了，编码的问题解决了。可是，我发现分词不了。请看结果： Array ( [0] => Array ( [word] => 我 [off] => 0 [len] => 2 [idf] => 0 [attr] => un ) [1] => Array...

135.仍然是第一个例子的问题，怎么连“中国人”都没分出来？

发布时间：2013-04-14 15:04 t By zctr

...文件存为ANSI形式了，编码的问题解决了。可是，我发现分词不了。请看结果： Array ( [0] => Array ( [word] => 我 [off] => 0 [len] => 2 [idf] => 0 [attr] => un ) [1] => Array...

136.删除文档

...引词**删除而不是该字段的值，索引词是指该字段值经过分词器处理后得到的词汇。对于索引方式为 `mixed` 的，如需删除，请把字段名设为类型为 `body` 的字段的名称。 ~~~ [php] $index->del('abc', 'subject'); // 删除字段 subject 上带有索...

137.刚开始使用，项目编码与时间戳问题请教

更新时间：2012-07-05 11:07 t By xilin

...sw，但是不知道有xunsearch,当时公司使用的是zend lucene和scsw分词，速度相当相当慢，查询总数5万条左右的记录要2秒以上。现在想换xunsearch试试

138.修正utf-8版make_xdb_file.php的错误

发布时间：2011-06-09 09:06 t By itlong

...，提示93行处的TF、IDF、Attr不存在，这明显示是：“[b]对分词再分词[/b]”带来的结果，在65行处看到only support GBK dictionary　到80行，这是不参对utf-8字符处理的，不能对中文(中英混合)字符进行mb_substr($word, 0, $len)切分,[u]mb_substr($wor...

139.xunsearch-1.4.6 (基于 xapian 和 scws开源中文搜索引擎，高扛压不再死锁)

更新时间：2013-03-27 13:03 t By hightman

.... 修改 XSTokenizerScws 以支持项目级自定义词典的 6. 自定义分词器的字段也能参与权重计算了，在 ini 指定 `non_bool = yes` 7. 采用 bootstrap 框架美化 util.SearchSkel 生成页面效果官方网站：[url]http://www.xunsearch.com[/url] 下载地址：[url]h...

140.最新的主要变动

...化代码兼容性 - 增加用户案例文档：USERCASE - 改进自定义分词器 XSTokenizerScws 接受参数作为复合等级 - 升级 libevent 到 2.x 版 - 修正中文 stopwords 不生效的问题 - 取消恼人的 NODB(S#506) 错误提示 - 新增获取文档匹配词表的接口 [XSSearch:...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索