搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

451.RE: 1.1.2的自定义字典无法使用

更新时间：2010-05-24 22:05 t By 逆雪寒

...sr/local/scws/etc => /usr/local/scws/etc [/php] 这是我代码: //分词 $so = scws_new(); $so->set_charset('utf8'); $rd = $so->set_dict('/usr/local/scws/etc/dict.utf8.xdb'); $rr = $so->set_rule('/usr/local/scws/etc/rules.utf8.ini'); //打印返回值 var_dump($rd); var_dump($rr); ...

452.xunsearch-1.4.1 (xapian+scws 开源搜索引擎，修正搜索进程死锁)

发布时间：2013-02-21 11:02 t By hightman

... C/C++ 开发多线程服务端，索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据，在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用：[/b]前端是使用脚本语言编写的开发工具 (SDK)，目前仅支持...

453.RE: [特别发布] 纯PHP编写的xdb词典导入导出工具！！

发布时间：2009-07-19 11:07 t By heraldboy

还有就是内存的问题，因为我希望在服务器端有个自动生成词库的功能，命令行方式不是很方便。主要是用机器先自动分词，人工发现不合理，再把新词增加进去。

454.LIBSCWS在WINDOWS下编译（C++调用，非PHP）

发布时间：2013-03-11 09:03 t By jasonniu

最近在搞分词相关的毕业设计是C++开发的想用大神的SCWS 把LIBSCWS编译成DLL来供我自己的程序调用但是在WINDOWS下编译老是过不了给的VC++6的项目也编译不成功，希望大神能指教下怎么在windows下编译

455.LIBSCWS在WINDOWS下编译（C++调用，非PHP）

发布时间：2013-03-11 09:03 t By jasonniu

最近在搞分词相关的毕业设计是C++开发的想用大神的SCWS 把LIBSCWS编译成DLL来供我自己的程序调用但是在WINDOWS下编译老是过不了给的VC++6的项目也编译不成功，希望大神能指教下怎么在windows下编译

456.RE: 请问一下，xdb与txt词库那个读取效率更高

发布时间：2013-07-03 16:07 t By hightman

但网址和EMAIL如果这样切，也太粗糙了吧。要全部匹配才能检索到，输入 EMAIL 的前段或网址的一部分均检索不到了。至于消除 HTML 标签，这不应该是分词的事哦

457.修正utf-8版make_xdb_file.php的错误

发布时间：2011-06-09 09:06 t By itlong

...，提示93行处的TF、IDF、Attr不存在，这明显示是：“[b]对分词再分词[/b]”带来的结果，在65行处看到only support GBK dictionary　到80行，这是不参对utf-8字符处理的，不能对中文(中英混合)字符进行mb_substr($word, 0, $len)切分,[u]mb_substr($wor...

458.XSTokenizerScws::setMulti

...SCWS_SET, XS_CMD_SCWS_SET_MULTI, $mode); return $this;} 设置复合分词选项

459.三个问题需要求教

发布时间：2011-01-17 11:01 t By nftw

...一体。有没有办法？ 3， GB2312编码中的繁体字不能正常分词，如“家電節能”，会分为　“家＋電＋節＋能”。总之 scws用着很顺手，感谢hightman.

460.RE: scws1.1.8为什么第一次都很慢。

发布时间：2011-10-24 11:10 t By hightman

我刚试了一下倒是很快啊。你说的第一次慢是重启WEB后第一次还是隔一段时间分词就会这样？

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索