搜索

大约有 546 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0056秒)

501.xunsearch 1.4.7安装问题在线等

发布时间:2013-09-28 15:09 t By youluolei

...了一天了实在找不出原因,求高手解答....有朋友说是没分词库,安装包中不是有scws包? 这个是什么原因在线等

502.RE: sunsearch如何解决一对多数据结构索引(coreseek的sql_attr_multi属性可以解决这个问题)

更新时间:2013-03-31 13:03 t By hightman

将分辨率数据转换成主表的一个字段,用 XSDocument::addTerm 添加索引或转换成特殊字段采用 split 分词

503.新增索引和更新索引速度好慢好慢,不能忍受,都在分钟级别上。

发布时间:2012-05-24 11:05 t By dkanaiwen

...只要求对content字段检索,其他字段都不需要参与检索和分词。 帖出我的配置文件: [tweetId] type = id tokenizer = none [content] type = body cutlen = 600 [authorId] tokenizer = none [sendTime] tokenizer = none [source] tokenizer = none [status] t...

504.xunsearch-1.4.7 (基于 xapian+scws 的开源中文搜索引擎,诸多细节改进)

发布时间:2013-07-30 11:07 t By hightman

... C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅支持...

505.RE: [特别发布] 纯PHP编写的xdb词典导入导出工具!!

更新时间:2011-03-01 22:03 t By hit

...面的排序完全改变了 目前的情况是我导出TXT在创建XDB 分词速度比之前慢了2倍 这个问题很想知道原因T-T XDB->TXT这似乎是一个很难逆转或者是无法逆转的过程 (我只是感觉到导出文件的TXT可能有问题)或者创建的XDB文件有...

506.求TF/IDF算法(官方的计算器没有作用)

发布时间:2013-05-22 13:05 t By zouhc

...果计算出来的大部分内容都是一样的值,而且也无法用于分词。 另外用这个计算器计算得到的TF和IDF值和词典中原先的不一样。 如:词典中的词语“辣椒油”在词典中是这样的: 辣椒油 13.45 9.22 n 我用计算器得出是这样...

507.求TF/IDF算法(官方的计算器没有作用)

发布时间:2013-05-22 13:05 t By zouhc

...果计算出来的大部分内容都是一样的值,而且也无法用于分词。 另外用这个计算器计算得到的TF和IDF值和词典中原先的不一样。 如:词典中的词语“辣椒油”在词典中是这样的: 辣椒油 13.45 9.22 n 我用计算器得出是这样...

508.为何导出txt,里面内容不动在创建XDB之后速度变慢很多很多

发布时间:2011-03-03 00:03 t By hit

...面的排序完全改变了 目前的情况是我导出TXT在创建XDB 分词速度比之前慢了2倍 这个问题很想知道原因T-T XDB->TXT这似乎是一个很难逆转或者是无法逆转的过程 (我只是感觉到导出文件的TXT可能有问题)或者创建的XDB文件有...

509.关于scws和词库的一些建议

更新时间:2011-04-23 21:04 t By lauxinz

建议支持词库里的词可以是纯英文单词,虽然在分词时英文单词可以自动识别切分开,但在关键词提取和非法词过滤时却无法提取出或过滤掉纯英文单词。 比如:我要从一些商品名中提取一些品牌:adidas nike。。。对商品名分词...

510.scws 1.1.2 php extension安装的问题

发布时间:2010-06-12 17:06 t By vinwuser

...ws,我用php 的 dl() 函数测试是否可以调用。这个可以,但分词结果不对,猜测是词库调用的原因,但我把xdb放到php同目录下或者调用/usr/local/scws/etc/下的词库,都得到scws_set_dict(): supplied argument is not a valid scws handler resource。这是...

  • 时间不限
  • 按相关性排序