搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

1.RE: 自定义词库用不了。非常不解啊。。

发布时间：2011-10-21 18:10 t By ci169

哎呀。搞定了。是txt编码问题郁闷。我就是说怎么不行呢。

2.RE: 自定义词库用不了。非常不解啊。。

发布时间：2011-10-23 23:10 t By hightman

如果你还需要原来的词典，请在 add_dict 前加 set_dict(ini_get('scws.default.fpath').'/dict.utf8.xdb');

3.480W数据单库搜索速度非常慢，官方所提到多库索引问题

发布时间：2012-08-27 19:08 t By qeenoo

... 一个库多少数据为好呢? 我现在 480W数据单库搜索速度非常慢。大概是2-4秒内。就3个字段索引。一个ID，标题，内容有什么好建议吗

4.RE: 自定义词库用不了。非常不解啊。。

发布时间：2011-10-23 23:10 t By ci169

[quote='hightman' pid='7092' dateline='1319384262'] 如果你还需要原来的词典，请在 add_dict 前加 set_dict(ini_get('scws.default.fpath').'/dict.utf8.xdb'); [/quote] 是的。这没问题了。是那txt编码问题。不是utf8的话就不行的。 scws我是用utf8。

5.RE: 480W数据单库搜索速度非常慢，官方所提到多库索引问题

发布时间：2012-08-30 12:08 t By hightman

480w 怎么会相当慢呢，也许你的配置或硬件比较不对？

6.RE: addweight

发布时间：2014-12-05 14:12 t By binny_w

非常非常非常感谢hightman，按你的建议修改了代码，实测下来，每条结果的权重值仍然会在比较大的范围内变化（可能是缓存）。

7.分词问题,不能分出单个字

更新时间：2013-01-07 15:01 t By rocl

麻烦看下: 例如: 跑马的时候非常的卡跑马-的-时候-非常-的卡最后分出来的"的卡"很明显是不正确的,请问下是否有办法解决, 应该是分成"跑马-的-时候-非常-的-卡" 感谢！！！[hr] 我找到了楼主原先的一个回复: 建议把这...

# mydict_utf8.txt 我是新增词爆红再试一个 [php] $text = '最近撑腰体爆红网络我是新增词再试一个'; class scws { public $so; function get_microtime() { list($usec, $sec) = explode(' ', microtime()); return ((float)$usec + (float)$sec); } ...

9.RE: Overflow bug

发布时间：2010-12-31 12:12 t By hovea

其实我更应该感谢你，这个程序做的非常棒。我找了很多分词的方案，做得如此精炼的只有这一个。这个错误造成的coredump 是无法预测的地方，所以非常难定位。

10.关于分词的错误

发布时间：2012-12-19 16:12 t By hechun1980

...过程中有一点奇怪的错误，如下：输入：跑马的时候非常的卡输出：跑马 | 的 | 时候 | 非常 | 的卡输入：求最新的卡怪物方法输出：求 | 最新 | 的卡 | 怪物 | 方法输入：这个副本可以单刷也可以组队去打输出：这个...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

搜索