搜索

大约有 191 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.3914秒)

111.一个疑问……

发布时间:2007-11-28 22:11 t By 逍遥小妖

...标点、中文等文字要素(可阅读部分,HTML已过滤),视情况而定,搜索引擎还有可能抓出含有乱码的片段。 但是SCWS分词时似乎要求字符串中只能有中文和中文标点,否则就会分词失败。 请问这个是我对SCWS的使用方法不正确...

112.RE: set ignore bug ?全角数字不见了

发布时间:2011-11-03 23:11 t By hightman

...应该是2者的词典不一样吧。。。你可以试试在不IGNORE的情况 下打印词情。

113.RE: 中文分组粗分方法

发布时间:2010-05-26 14:05 t By hightman

...部分拧出来,以其中一个词为主体进行计算权重,看哪个情况最优。 此外还有根据rules规则匹配。 简单举个例子: “开放下载” 1. 开/放下/载 2. 开放/下载 根据词典中的tdf进行一个运算得出概率而采取最高的那种

114.RE: 新增 CHM 格式的离线文档下载(内含API、指南、关于)

发布时间:2011-09-24 12:09 t By netyum

Hi,建求使用utf-8编码,或指定utf-8 header 具体不清楚什么情况,我在mac环境出现乱码 [attachment=2]

115.英文与数字组合词分词错误

发布时间:2014-04-20 16:04 t By tenjin

scws分词时出现这样的情况,英文字母与数字组合分词时,若词的前面或后面有标点符号,则英文字母和数字将会被拆分开,不知道是什么原因?有没有解决的办法? ./scws -c utf8 -i mp3 mp3 +--[scws(scws-cli/1.2.2)]----------+ | TextLen: 3...

116.scws1.2.2 php 扩展问题

发布时间:2013-10-13 02:10 t By kevinwang

...这是怎么回事,即使不需要set_dict也可以分词 另外这种情况下,set_dict感觉和add_dict一样,我的词典和编译进去的那个词典会一起使用 一些文章带有大量的链接http:// 结果 http com www 这些词 会被放到结果中,要怎么避免?

117.total不准确

更新时间:2012-08-21 17:08 t By gaosboy

符合条件的索引共有161条,但offset不是最后一页的情况下,显示的total为 310条 [code]# php Quest.php ~/dev/config/search/question.ini --query="answered:0 AND (status:0 OR status:1)" --limit 120,30|head -n 1 在 1,525 条数据中,大约有 310 条包含 answered:0 AND (...

118.RE: 平滑重建索引,提示 "DB has been rebuilding" 就退出了。

发布时间:2012-08-08 16:08 t By ghxter

...要完成,否则就会卡在那里。 建议大家测试没有问题的情况下,使用后台执行的方式进行 rebuild 重建索引。

119.RE: 迅搜报错

更新时间:2013-02-27 09:02 t By 277850318@qq.com

...尝试开始检索了? 或者贴上你的代码和目前索引库的情况? [/quote]

120../sdk/php/util/Indexer.php --source=csv --clean demo

发布时间:2012-05-14 10:05 t By shicancan

在我只安装了mysql数据库,没有任何数据源的情况下,如何使用demo项目。谢谢指教![img]http://mon.d1505.com/mmcms/tt.jpg[/img]

  • 时间不限
  • 按相关性排序