搜索

大约有 546 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1955秒)

451.RE: 1.1.2的 自定义字典无法使用

更新时间:2010-05-24 22:05 t By 逆雪寒

...sr/local/scws/etc => /usr/local/scws/etc [/php] 这是我代码: //分词 $so = scws_new(); $so->set_charset('utf8'); $rd = $so->set_dict('/usr/local/scws/etc/dict.utf8.xdb'); $rr = $so->set_rule('/usr/local/scws/etc/rules.utf8.ini'); //打印返回值 var_dump($rd); var_dump($rr); ...

452.xunsearch-1.4.1 (xapian+scws 开源搜索引擎,修正搜索进程死锁)

发布时间:2013-02-21 11:02 t By hightman

... C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅支持...

453.RE: [特别发布] 纯PHP编写的xdb词典导入导出工具!!

发布时间:2009-07-19 11:07 t By heraldboy

还有就是内存的问题,因为我希望在服务器端有个自动生成词库的功能,命令行方式不是很方便。 主要是用机器先自动分词,人工发现不合理,再把新词增加进去。

454.LIBSCWS在WINDOWS下编译(C++调用,非PHP)

发布时间:2013-03-11 09:03 t By jasonniu

最近在搞分词相关的毕业设计 是C++开发的 想用大神的SCWS 把LIBSCWS编译成DLL来供我自己的程序调用 但是在WINDOWS下编译老是过不了 给的VC++6的项目也编译不成功,希望大神能指教下怎么在windows下编译

455.LIBSCWS在WINDOWS下编译(C++调用,非PHP)

发布时间:2013-03-11 09:03 t By jasonniu

最近在搞分词相关的毕业设计 是C++开发的 想用大神的SCWS 把LIBSCWS编译成DLL来供我自己的程序调用 但是在WINDOWS下编译老是过不了 给的VC++6的项目也编译不成功,希望大神能指教下怎么在windows下编译

456.RE: 请问一下,xdb与txt词库那个读取效率更高

发布时间:2013-07-03 16:07 t By hightman

但网址和EMAIL如果这样切,也太粗糙了吧。要全部匹配才能检索到,输入 EMAIL 的前段或网址的一部分均检索不到了。 至于消除 HTML 标签,这不应该是分词的事哦

457.修正utf-8版make_xdb_file.php的错误

发布时间:2011-06-09 09:06 t By itlong

...,提示93行处的TF、IDF、Attr不存在,这明显示是:“[b]对分词分词[/b]”带来的结果,在65行处看到only support GBK dictionary 到80行,这是不参对utf-8字符处理的,不能对中文(中英混合)字符进行mb_substr($word, 0, $len)切分,[u]mb_substr($wor...

458.XSTokenizerScws::setMulti

...SCWS_SET, XS_CMD_SCWS_SET_MULTI, $mode); return $this;} 设置复合分词选项

459.三个问题需要求教

发布时间:2011-01-17 11:01 t By nftw

...一体。有没有办法? 3, GB2312编码中的繁体字不能正常分词,如“家電節能”,会分为 “家+電+節+能”。 总之 scws用着很顺手,感谢hightman.

460.RE: scws1.1.8为什么第一次都很慢。

发布时间:2011-10-24 11:10 t By hightman

我刚试了一下倒是很快啊。 你说的第一次慢是重启WEB后第一次还是隔一段时间分词就会这样?

  • 时间不限
  • 按相关性排序