搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

1.RE: scws_has_word没有得到部分指定词库中的词

更新时间：2011-12-09 11:12 t By michaele

...断指定词性我自定义词库格式如下：销售什么 1.0 1.0 * 出售什么 1.0 1.0 * 出售各式 1.0 1.0 * 某词 1.0 1.0 * scws_t s=scws_new(); 用下面这个函数可以分出“某词”， scws_get_tops(s,1000,NULL); ...

2.RE: 搜索全文时较慢，在0.5+秒，甚至1.0+秒【900M数据库】

发布时间：2013-07-05 17:07 t By chinapubmed

[php][root@west123110 tmp]# dd bs=64k count=4k if=/dev/zero of=test oflag=dsync 记录了4096+0 的读入记录了4096+0 的写出 268435456字节(268 MB)已复制，24.6265 秒，10.9 MB/秒 [/php] 经hightman老大测试，似乎是硬盘的读取速度太慢了。好吧，看来要换个...

3.RE: [2010] SCWS-1.1.5 发布，修正一些BUG，支持文本词典实现自定义词库啦！！

发布时间：2011-03-08 19:03 t By binux

...这样的 ; dict_extra.txt 我是新增词 2.0 再试一个 1.0 1.0 @ ; 以下词为删除项删除 1.0 1.0 ! scws -d /usr/local/scws/dict_extra.txt -c utf-8 我是新增词我是新增词再试一个再试一个

4.SCWS不支持英文和中英文混合分词吗？

更新时间：2010-08-24 20:08 t By fuhehe

...) { var_dump($tmp); } $so->close(); 在words.txt只定义如下内容 GM 1.0 1.0 * hello指导员 1.0 1.0 * 而输出结果为： array(1) { [0]=> array(5) { ["word"]=> string(7) "GMhello" ["off"]=> int(0) ["len"]=> int(7) ["idf"]=> float(4.86477518082) ["a...

5.搜索全文时较慢，在0.5+秒，甚至1.0+秒【900M数据库】

更新时间：2013-07-05 15:07 t By chinapubmed

#问题在全文中搜索长的英文时（10个单词左右，就是一篇文章的英文标题），速度较慢（大部分是0.5秒左右，有时1秒多，有时甚至2秒多），上次与hightman交流，说是配置可能有问题，贴出来大家帮看看，谢谢了！搜索主要用...

6.如何修正分词错误

更新时间：2012-01-06 16:01 t By worldwind

...由 v 改为： e 新建一个userdic辞书，然后添加：了 1.0 1.0 e 通过：scws_add_dict(s, "/usr/local/scws/etc/userdict.utf8.xdb", SCWS_XDICT_XDB); 结果还是不对。

7.[已解决]在php cli 下测试自定义字典的更新问题

更新时间：2010-10-13 16:10 t By 逆雪寒

自定义的字典是 utf8 的哦你呀武不只我是谁精武英雄 1.0 1.0 tt 代码是这样的

8.想手动指定一些不进行分词的词语

发布时间：2013-07-23 16:07 t By seagg

...用户自定义词典 dict_user.txt 我在里面写了：米兔车贴 1.0 1.0 ! 但还是被分了还看到一个stopwords.txt的文件，但将米兔车贴放到里面了也还是会被分。。。

9.RE: 在php cli 下测试自定义字典的更新问题

发布时间：2010-10-13 10:10 t By 逆雪寒

...t.php dict content: 哦你呀武不只我是谁精武英雄 1.0 1.0 tq ------- Array ( [0] => Array ( [word] => 精武英雄 [off] => 0 [len] => 12 [idf] => 1 [attr] => tf ) ) 字...

10.自定义的词语用hasword返回true getresult没有出现自定义的词语

发布时间：2014-05-06 19:05 t By min

... -> cws -> getresult($string); var_dump($re); } dict_1.txt 新增词 1.0 1.0 n hasword返回的结果是true getresult返回的结果是我是新增词我想要的结果是我是新增词调用讯搜的api

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索