搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

141.求助，搜索词有最短限制吗

更新时间：2014-05-22 15:05 t By 鸭梨山大

...啊加上双引号也搜不出来是不是这个有最短限制啊一个字符搜索不了啊求助

142.RE: SCWS 能否添加 “中文＋英文”和“中文＋数字”自定义词

更新时间：2012-09-03 11:09 t By hightman

scws源码中写死的…… 超过２个字符的英文数字都在第一步被预处理了，所以想要改这个恐怕了也会比较麻烦。

143.RE: scws1.1.2 安装错误

发布时间：2010-05-13 17:05 t By hightman

应该是分词词典没有正确加载。如果你在php.ini中没有正确指定路径的话scws.default.fpath以及字符集 scws.default.charset 你应该在分词代码中明确指定这些 $s->add_dict(); 或 $scws->set_dict(); 还有 $scws->set_charset() 应该在此之前调用

144.XSDocument

...词列表 (仅限索引文档) XSDocument getCharset() 获取文档字符集 XSDocument getFields() 获取字段值 XSDocument getIterator() IteratorAggregate 接口, 以支持 foreach 遍历访问字段列表 XSDocument offsetExists() ArrayAccess 接口, 判断字段...

145.RE: 怎样才能字母数字汉字组合按照词典分成一个词语呢？

发布时间：2013-07-03 14:07 t By hightman

其实SCWS内部是允许最多2个非中文字符夹杂中文成词的，超过2个的就无效了。比如”Q币“，”T恤“这种是支持的。像你这么长的编号支持通用性不强。。

146.SCWS_XDICT_MEM模式

发布时间：2011-11-10 00:11 t By clearchen

...utf8.xdb",SCWS_XDICT_MEM); 如果去掉SCWS_XDICT_MEM，则分割同样的字符串时间增加，请教这种模式的原理， apache 以loadmodule跑php,一次页面执行完毕后，应该都已经释放资源了，很困惑。。。

147.XSDatabasePDO_MySQL::setUtf8

... return $this->obj->prepare("SET NAMES utf8")->execute();} 将输出字符集设置为 UTF-8

148.RE: 对于分词的一些困惑

发布时间：2010-10-13 17:10 t By hightman

...功切分的。原因就在于最多允许夹在汉字之间的只有2个字符～～这个粗分规则是为了加速和减少误分，对于全文检索功能，像你的情况分成“北海”+365也应当算合理吧

149.一个疑问……

发布时间：2007-11-28 22:11 t By 逍遥小妖

...还有可能抓出含有乱码的片段。但是SCWS分词时似乎要求字符串中只能有中文和中文标点，否则就会分词失败。请问这个是我对SCWS的使用方法不正确还是SCWS目前只能做成这样？目前我企图将抓取后的内容剔除全部不可分词要...

150.RE: set ignore bug ?全角数字不见了

发布时间：2011-11-03 23:11 t By hightman

... [/quote] 那很奇怪，我用WINDOWS下的DLL ，他就不会把全角字符这个给去掉 [/quote] 那应该是2者的词典不一样吧。。。你可以试试在不IGNORE的情况下打印词情。

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索