搜索

大约有 214 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1974秒)

141.求助,搜索词有最短限制吗

更新时间:2014-05-22 15:05 t By 鸭梨山大

...啊 加上双引号也搜不出来 是不是这个有最短限制啊 一个字符搜索不了啊 求助

142.RE: SCWS 能否添加 “中文+英文”和“中文+数字”自定义词

更新时间:2012-09-03 11:09 t By hightman

scws源码中写死的…… 超过2个字符的英文数字都在第一步被预处理了,所以想要改这个恐怕了也会比较麻烦。

143.RE: scws1.1.2 安装错误

发布时间:2010-05-13 17:05 t By hightman

应该是分词词典没有正确加载。 如果你在php.ini中没有正确指定路径的话scws.default.fpath以及字符集 scws.default.charset 你应该在分词代码中明确指定这些 $s->add_dict(); 或 $scws->set_dict(); 还有 $scws->set_charset() 应该在此之前调用

144.XSDocument

...词列表 (仅限索引文档) XSDocument getCharset() 获取文档字符集 XSDocument getFields() 获取字段值 XSDocument getIterator() IteratorAggregate 接口, 以支持 foreach 遍历访问字段列表 XSDocument offsetExists() ArrayAccess 接口, 判断字段...

145.RE: 怎样才能 字母数字汉字组合 按照词典分成一个词语呢?

发布时间:2013-07-03 14:07 t By hightman

其实SCWS内部是允许最多2个非中文字符夹杂中文成词的,超过2个的就无效了。 比如”Q币“,”T恤“这种是支持的。像你这么长的编号支持通用性不强。。

146.SCWS_XDICT_MEM模式

发布时间:2011-11-10 00:11 t By clearchen

...utf8.xdb",SCWS_XDICT_MEM); 如果去掉SCWS_XDICT_MEM,则分割同样的字符串时间增加, 请教这种模式的原理, apache 以loadmodule跑php,一次页面执行完毕后,应该都已经释放资源了,很困惑。。。

147.XSDatabasePDO_MySQL::setUtf8

... return $this->obj->prepare("SET NAMES utf8")->execute();} 将输出字符集设置为 UTF-8

148.RE: 对于分词的一些困惑

发布时间:2010-10-13 17:10 t By hightman

...功切分的。 原因就在于最多允许夹在汉字之间的只有2个字符~~ 这个粗分规则是为了加速和减少误分,对于全文检索功能,像你的情况分成“北海”+365也应当算合理吧

149.一个疑问……

发布时间:2007-11-28 22:11 t By 逍遥小妖

...还有可能抓出含有乱码的片段。 但是SCWS分词时似乎要求字符串中只能有中文和中文标点,否则就会分词失败。 请问这个是我对SCWS的使用方法不正确还是SCWS目前只能做成这样? 目前我企图将抓取后的内容剔除全部不可分词要...

150.RE: set ignore bug ?全角数字不见了

发布时间:2011-11-03 23:11 t By hightman

... [/quote] 那很奇怪,我用WINDOWS下的DLL ,他就不会把全角字符这个给去掉 [/quote] 那应该是2者的词典不一样吧。。。你可以试试在不IGNORE的情况 下打印词情。

  • 时间不限
  • 按相关性排序