搜索

大约有 200 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1005秒)

131.求TF/IDF算法(官方的计算器没有作用)

发布时间:2013-05-22 13:05 t By zouhc

...果计算出来的大部分内容都是一样的值,而且也无法用于分词。 另外用这个计算器计算得到的TF和IDF值和词典中原先的不一样。 如:词典中的词语“辣椒油”在词典中是这样的: 辣椒油 13.45 9.22 n 我用计算器得出是这样...

132.求TF/IDF算法(官方的计算器没有作用)

发布时间:2013-05-22 13:05 t By zouhc

...果计算出来的大部分内容都是一样的值,而且也无法用于分词。 另外用这个计算器计算得到的TF和IDF值和词典中原先的不一样。 如:词典中的词语“辣椒油”在词典中是这样的: 辣椒油 13.45 9.22 n 我用计算器得出是这样...

133.scws 1.1.2 php extension安装的问题

发布时间:2010-06-12 17:06 t By vinwuser

...ws,我用php 的 dl() 函数测试是否可以调用。这个可以,但分词结果不对,猜测是词库调用的原因,但我把xdb放到php同目录下或者调用/usr/local/scws/etc/下的词库,都得到scws_set_dict(): supplied argument is not a valid scws handler resource。这是...

134.仍然是第一个例子的问题,怎么连“中国人”都没分出来?

发布时间:2013-04-14 15:04 t By zctr

...文件存为ANSI形式了,编码的问题解决了。 可是,我发现分词不了。请看结果: Array ( [0] => Array ( [word] => 我 [off] => 0 [len] => 2 [idf] => 0 [attr] => un ) [1] => Array...

135.仍然是第一个例子的问题,怎么连“中国人”都没分出来?

发布时间:2013-04-14 15:04 t By zctr

...文件存为ANSI形式了,编码的问题解决了。 可是,我发现分词不了。请看结果: Array ( [0] => Array ( [word] => 我 [off] => 0 [len] => 2 [idf] => 0 [attr] => un ) [1] => Array...

136.删除文档

...引词**删除而不是该字段的值,索引词是指该字段值经过分词器处理后得到的词汇。 对于索引方式为 `mixed` 的,如需删除,请把字段名设为类型为 `body` 的字段的名称。 ~~~ [php] $index->del('abc', 'subject'); // 删除字段 subject 上带有索...

137.刚开始使用,项目编码与时间戳问题请教

更新时间:2012-07-05 11:07 t By xilin

...sw,但是不知道有xunsearch,当时公司使用的是zend lucene和scsw分词,速度相当相当慢,查询总数5万条左右的记录要2秒以上。现在想换xunsearch试试

138.修正utf-8版make_xdb_file.php的错误

发布时间:2011-06-09 09:06 t By itlong

...,提示93行处的TF、IDF、Attr不存在,这明显示是:“[b]对分词分词[/b]”带来的结果,在65行处看到only support GBK dictionary 到80行,这是不参对utf-8字符处理的,不能对中文(中英混合)字符进行mb_substr($word, 0, $len)切分,[u]mb_substr($wor...

139.xunsearch-1.4.6 (基于 xapian 和 scws开源中文搜索引擎,高扛压不再死锁)

更新时间:2013-03-27 13:03 t By hightman

.... 修改 XSTokenizerScws 以支持项目级自定义词典的 6. 自定义分词器的字段也能参与权重计算了,在 ini 指定 `non_bool = yes` 7. 采用 bootstrap 框架美化 util.SearchSkel 生成页面效果 官方网站:[url]http://www.xunsearch.com[/url] 下载地址:[url]h...

140.最新的主要变动

...化代码兼容性 - 增加用户案例文档:USERCASE - 改进自定义分词器 XSTokenizerScws 接受参数作为复合等级 - 升级 libevent 到 2.x 版 - 修正中文 stopwords 不生效的问题 - 取消恼人的 NODB(S#506) 错误提示 - 新增获取文档匹配词表的接口 [XSSearch:...

  • 时间不限
  • 按相关性排序