搜索

大约有 85 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1943秒)

31.RE: scws 词库与dict_user.txt文件有什么关系?

发布时间:2012-04-19 14:04 t By 290977824@qq.com

问题是,我在现存的词上创建同义词,也不是无效的!!!不得不采用index search 的or 语法

32.报告一个内存泄露bug,1.1.6版本

发布时间:2011-05-07 17:05 t By lauxinz

scws 1.1.6 采用valgrind程序运行了一下,显示存在内存泄露,查看了一下源代码,的确有一个地方没有free。在 scws.c/scws_has_word()函数中: __PARSE_XATTR__; // 这个宏里有一个内存申请:at = (word_attr *) malloc(cnt); 申请的内存没有释放。应...

33.scws-1.1.2 发布, 修正人名识别失败的问题

发布时间:2010-05-09 02:05 t By hightman

...搜索结果不全。经仔细排查问题在于 scws 分词中。 当采用非内存模式的词典时,返回的查结结果中(word_st)...->flag的属性包含怕 SCWS_WORD_MALLOCED 与 SCWS_ZFLAG_SYMBOL 定义冲突,以至于被当作符号文字从而未能进行正确的人名识别。 ...

34.PHP4版 简易中文分词(PSCWS) 第2/3版

发布时间:2007-06-06 09:06 t By hightman

...个版本的用法完全一样,主要区别在于分词的算法,前者采用正向最大匹配2级交叉消岐,而后者采用的是双向匹配综合消岐。并没有绝对的谁优谁劣,似乎半斤八两。 两者都是基于词典词频查询,推荐词典格式为 cdb,因为它...

35.C版简易中文分词-cscwsd-0.0.3 发布

发布时间:2007-06-06 10:06 t By hightman

...都方便的实现,发布包中附带了一系列 misc/CWS_*.php,均是采用 PHP 编写的访问例子。切词速度比原 PHP直接分词要提高数十倍以上。 词典采用的是 .txt 格式,解决了编辑困扰问题。格式非常简单,一行一条目,词与频率之间用(TAB...

36.RE: [HELP]xunsearch安装好了,搜索没有结果集。。。

发布时间:2011-10-27 16:10 t By hightman

...ine='1319615395'] 非常感谢...也在刚开始学习xunsearch xunsearch采用 scws 分词 xunsearch好像集成了 scws 对于分词 xunsearch 可以通过 XSTokenizer 扩展 我想问的是 既然是 集成scws 那么 1.有没有提供scws的api接口,实现短语分词功能 2.是否可...

37.请问一下,xdb与txt词库那个读取效率更高

发布时间:2013-06-29 21:06 t By 阿弟2013

...文部分,包括email,url,host这类处理效果比较差,我们目前采用两个分析器配合使用来达到最好的效果,要是scws能处理得了像email,host,url和tag之类的分类,那效率应该是更棒了 谢谢你们的无私开源这么好的作品

38.构建搜索语句

...空格把搜索词、名子连接起来的方式最为常用。内部默认采用 `AND` 规则, 也就是说要求列出来的关键词(分词之后)全部匹配,如果您通过 [XSSearch::setFuzzy] 开启了模糊匹配,那么相当于采用 `OR` 规则,只要其中一个关键词匹...

39.配置文件的困惑

发布时间:2012-03-16 17:03 t By 张十三

tokenizer 分词器 默认为 default 采用内置的功能强大的 scws 分词,适合绝大多数字符串字段。也可以指定自定义分词器,格式为 name 或 name(arg) 两种形式,其中 name 是分词器名称,arg 则是传递给分词器构造函数的参数。自定义分词...

40.scws-1.1.6 发布

更新时间:2011-04-20 15:04 t By hightman

...*.h)按装到 $prefix/include/scws 而不是以前的 $prefix/include,故采用C API开发时头部建议写 #include 下载地址:[url]http://www.ftphp.com/scws/download.php[/url]

  • 时间不限
  • 按相关性排序