搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

501.xunsearch 1.4.7安装问题在线等

发布时间：2013-09-28 15:09 t By youluolei

...了一天了实在找不出原因，求高手解答....有朋友说是没分词库，安装包中不是有scws包？这个是什么原因在线等

502.RE: sunsearch如何解决一对多数据结构索引（coreseek的sql_attr_multi属性可以解决这个问题）

更新时间：2013-03-31 13:03 t By hightman

将分辨率数据转换成主表的一个字段，用 XSDocument::addTerm 添加索引或转换成特殊字段采用 split 分词器

503.新增索引和更新索引速度好慢好慢，不能忍受，都在分钟级别上。

发布时间：2012-05-24 11:05 t By dkanaiwen

...只要求对content字段检索，其他字段都不需要参与检索和分词。帖出我的配置文件： [tweetId] type = id tokenizer = none [content] type = body cutlen = 600 [authorId] tokenizer = none [sendTime] tokenizer = none [source] tokenizer = none [status] t...

504.xunsearch-1.4.7 (基于 xapian+scws 的开源中文搜索引擎，诸多细节改进)

发布时间：2013-07-30 11:07 t By hightman

... C/C++ 开发多线程服务端，索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据，在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用：[/b]前端是使用脚本语言编写的开发工具 (SDK)，目前仅支持...

505.RE: [特别发布] 纯PHP编写的xdb词典导入导出工具！！

更新时间：2011-03-01 22:03 t By hit

...面的排序完全改变了目前的情况是我导出TXT在创建XDB 分词速度比之前慢了2倍这个问题很想知道原因T-T XDB->TXT这似乎是一个很难逆转或者是无法逆转的过程 (我只是感觉到导出文件的TXT可能有问题)或者创建的XDB文件有...

506.求TF/IDF算法（官方的计算器没有作用）

发布时间：2013-05-22 13:05 t By zouhc

...果计算出来的大部分内容都是一样的值，而且也无法用于分词。另外用这个计算器计算得到的TF和IDF值和词典中原先的不一样。如：词典中的词语“辣椒油”在词典中是这样的：辣椒油 13.45 9.22 n 我用计算器得出是这样...

507.求TF/IDF算法（官方的计算器没有作用）

发布时间：2013-05-22 13:05 t By zouhc

...果计算出来的大部分内容都是一样的值，而且也无法用于分词。另外用这个计算器计算得到的TF和IDF值和词典中原先的不一样。如：词典中的词语“辣椒油”在词典中是这样的：辣椒油 13.45 9.22 n 我用计算器得出是这样...

508.为何导出txt,里面内容不动在创建XDB之后速度变慢很多很多

发布时间：2011-03-03 00:03 t By hit

...面的排序完全改变了目前的情况是我导出TXT在创建XDB 分词速度比之前慢了2倍这个问题很想知道原因T-T XDB->TXT这似乎是一个很难逆转或者是无法逆转的过程 (我只是感觉到导出文件的TXT可能有问题)或者创建的XDB文件有...

509.关于scws和词库的一些建议

更新时间：2011-04-23 21:04 t By lauxinz

建议支持词库里的词可以是纯英文单词，虽然在分词时英文单词可以自动识别切分开，但在关键词提取和非法词过滤时却无法提取出或过滤掉纯英文单词。比如：我要从一些商品名中提取一些品牌：adidas nike。。。对商品名分词...

510.scws 1.1.2 php extension安装的问题

发布时间：2010-06-12 17:06 t By vinwuser

...ws，我用php 的 dl() 函数测试是否可以调用。这个可以，但分词结果不对，猜测是词库调用的原因，但我把xdb放到php同目录下或者调用/usr/local/scws/etc/下的词库，都得到scws_set_dict(): supplied argument is not a valid scws handler resource。这是...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索