搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

61.RE: ./sdk/php/util/Indexer.php --source=csv --clean demo

发布时间：2012-04-27 11:04 t By hightman

进入源码看看吧，好像你的 fsockopen() 返回了 null，根据PHP手册讲不可能这个返回值的

62.RE: 我想使用系统自动的分词功能，可是只看到有接口

发布时间：2011-11-25 09:11 t By limingyao

...ote] 嗯，可能描述不清。我就是想有一段文字，然后根据这段文字分词，实现类似tag这样的功能。其实和引擎关系不大，如果没有这个功能的话，只有去另外安装。。比较麻烦

63.RE: 索引到一大半的时候出错退出，有没有办法继续？

发布时间：2011-10-25 09:10 t By hpxl

...php错误了。判断是不是某条数据是不是已经存在了，可以根据主键来判断是不是已存在，存在的跳过就可以了。例如： [php]$query = "id:1753"; $docs = $xs->search->search($query); print_r($docs);[/php]

64.RE: 怎么分库才能优化好搜索性能？

发布时间：2011-11-07 13:11 t By hightman

...按时间段切割，但不建议分割过多。在索引数据入库时根据时间判断该对应哪个库名，比如用 db_1, db_2, ... 来区分而在搜索的时候统一用 addDb 把所有的 db 都添加进支就可以了。分后库对于旧库还可以调用 bin/xapian-compact 进...

很简单啊，根据先 add_dict 后生效的原则，你把自定义的放后在。 $scws->add_dict(ini_get('scws.default.fpath') . '/dict.utf8.xdb'); $scws->add_dict('/path/to/dict.self.txt', SCWS_XDICT_TXT); 那么就是后面的 dict.self.txt 优先查询，如果 dict.self.txt 中不存在...

66.RE: 麻烦站长解释一下“透过scws_get_result()取数据时自行排除单个字”

发布时间：2010-08-22 00:08 t By hightman

返回的时候根据长度排除啊，GBK的话单字就是2字节，很好判断啊，UTF-8三字节，但也能判断出是不是一个单个的汉字

67.iis+php5.2.X下配置utf8的scws的问题

发布时间：2011-03-03 17:03 t By sonictan

我根据论坛和ftphp网站上要求，在自己的服务器上配置SCWS，但始终无法分词。我需要的是utf8编码的。测试文件在gbk下好使，应该如何改成utf8格式的？请教管理员，我该如何操作。 :huh:

68.请问一对多的数据关系的数据如何更新索引？

更新时间：2013-10-30 23:10 t By gdtv

..., category } 假如说一个article包含N个article_category，我想根据article_category的内容对article做分面搜索[/quote] 可以有两种实现方式： 1、使用XSDocument::addTerm 2、弄一个字段存放以|号分隔的多个article_category.id，把这个字段tokenizer ...

69.RE: Cygwin 编译 scws1.1.5 make 时报错

更新时间：2012-06-01 20:06 t By BourneLi

...在没有定义main时，会报次错误[hr] 终于找到解决方案了，根据cgywin官方资料（http://cygwin.com/faq/faq-nochunks.html#faq.programming.winmain），缺乏main函数。所以在libscws下面任意一个.c文件中添加代码：int main() {return 0;} 然后编译，就可以...

70.RE: 请教：关于地市信息的分词结果，如何更准确？

发布时间：2010-09-26 20:09 t By hightman

... 1 1 ! 阳道 1 1 ! 道南路 4 2 nz 小白兔 4 2 n [/code] 以下我是根据你的实例编写的，你可以在理解的基础上自己完善这个扩展词典。

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

搜索