搜索

大约有 546 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1953秒)

471.RE: scws_has_word的逻辑问题

更新时间:2010-07-29 15:07 t By backluck

...本中是否包含这些属性的词。 scws_get_words 是按词性返回分词结果,标点的词应该默认应该是 un 或 # 之类可以自行排除。 [/quote] 关于has_word,我的意思是说,当我不传属性参数,返回的会是0

472.RE: 特别活动:11.25~12.15期间可免费为用户定制 xunsearch 搜索项目

发布时间:2011-12-01 21:12 t By huidoo

支持多表搜索吗,以前用的是迅狗,后来用的织梦分词,最近刚发现有这个了,想试试。

473.RE: scws1.1.1错误:

发布时间:2010-05-07 17:05 t By gaoomei

...是1.0.0版本编译好后,能够在php -m列表中显示出来,但是分词的时候会中断php执行,但是这个错误无法看到,只是中断了!希望大大能改进一下,让错误能够报出来,比如那个blitz模块就有错误报告。呵呵·

474.RE: [HELP]xunsearch安装好了,搜索没有结果集。。。

发布时间:2011-10-19 16:10 t By hpxl

...计有点问题。当type为string,没有指明index索引方式是是不分词的。 [title] type=string index=both 和 [title] type=title 这两个字段设计效果一样。同样content,类型也有问题,可以这样 [content] type=body 或者 [content] type=string index=mixed 具体详看...

475.scws-1.1.2 发布, 修正人名识别失败的问题

发布时间:2010-05-09 02:05 t By hightman

...友发现部分情况搜索结果不全。经仔细排查问题在于 scws 分词中。 当采用非内存模式的词典时,返回的查结结果中(word_st)...->flag的属性包含怕 SCWS_WORD_MALLOCED 与 SCWS_ZFLAG_SYMBOL 定义冲突,以至于被当作符号文字从而未能进行正...

476.RE: 求TF/IDF算法(官方的计算器没有作用)

发布时间:2013-05-22 13:05 t By hightman

TF/IDF值不会导致用不到分词,只是靠在一起时需要消岐才用得到。你自定义词典用不了要查查是什么别的原因。 通常问题: 1.词典写的字符集不对,比如把GBK当UTF-8了 2.词典更新后的修改时间由于某些原因比/tmp目录下生成的临...

477.RE: 请问虾片中的枚举类型,在xunsearch 怎么表示?

更新时间:2013-11-26 13:11 t By hightman

...是这个道理,因为没有做”梨“的索引呗。当你想办法让分词器能产生这个词/字时就可以检索到。

478.xunsearch-1.4.0 (基于xapian+scws的开源中文搜索,大幅改进性能及稳定性)

发布时间:2013-01-22 12:01 t By hightman

... C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 5 亿网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目前仅支持...

479.RE: 结合搜索引擎来制作自动标签系统

发布时间:2011-12-14 09:12 t By rogical

...分类性的,这个不能简单由前10来实现,比如‘你好’被分词出来,而且频度很高,却不适合做标签的; 有些热门的词汇,流行词汇,那种带有明显时效性可以加权,如‘凤姐’,‘芙蓉姐姐’, 有点类似百度风云榜的感觉; ...

480.XSTokenizerScws::setDict

...fpath); unset($this->_setting['add_dict']); return $this;} 设置分词词典, 支持 TXT/XDB 格式

  • 时间不限
  • 按相关性排序