搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

101.仍然是第一个例子的问题，怎么连“中国人”都没分出来？

发布时间：2013-04-14 15:04 t By zctr

... 我已经将文件存为ANSI形式了，编码的问题解决了。可是，我发现分词不了。请看结果： Array ( [0] => Array ( [word] => 我 [off] => 0 [len] => 2 [idf] => 0 [attr] => un ) ...

102.仍然是第一个例子的问题，怎么连“中国人”都没分出来？

发布时间：2013-04-14 15:04 t By zctr

... 我已经将文件存为ANSI形式了，编码的问题解决了。可是，我发现分词不了。请看结果： Array ( [0] => Array ( [word] => 我 [off] => 0 [len] => 2 [idf] => 0 [attr] => un ) ...

103.RE: 搜索骨架代码测试时报错

发布时间：2011-10-17 15:10 t By hightman

...的骨架代码后，对应的项目配置文件(ini)中的搜索服务端是怎么写的呢 server.search = ??? 是否在后面多了空格，如果是本地建议省去。会提示 permission denied 通常是因为连接的是 unix socket 而非 TCP连接，所以最好你也检查一下你的...

数据库有一张article表。编码是gbk_chinese_ci，配置文件article.ini中我设置如下： project.name = article project.default_charset = UTF-8 [aid] type = id [title] type = both [smalltitle] type = string [copyfrom] type = string [totalhit] type = string [keywords] type = string ...

105.“有空间”的分词有问题和扩充词典

更新时间：2013-05-18 14:05 t By lyjkensou

使用的是scws-1.2.1 对“有空间”这个句子进行分词，理想的结果应该是“有空空间” 但实际结果是“有空间” 即使通过scws_add_dict()添加了自定义的txt字典（里面只包含“空间 11.82 12.38”一行），仍然分不出“空间”这个词。...

106.RE: 纯HTML页面如何收录

发布时间：2012-03-14 20:03 t By iqpkeq

[quote='hightman' pid='639' dateline='1331712167'] 那你说的应该是XML数据源，HTML不好当数据源吧 [/quote] 呃，H大，我想到的是，Xunsearch既然是出色的全文搜索引擎，那么应该具有的功能是：类似百度或者谷歌的，那么应该优先可以...

107.字典中的条目的意义与来源

发布时间：2009-08-25 22:08 t By peng860215

....89 6.26 nz 文学 14.89 3.91 n 二列为词频，三列为词重，可是词频与词重是怎么计算的，单位是什么，词重是什么含义呢？为什么相同的词频，词重会有差别，如表中“新浪” 词重为6.26 还有，在实际应用中，是不是不用管词频...

108.RE: 用骨架自动生成的search.php访问没有数据是怎么回事，管理员大哥帮帮忙

发布时间：2012-12-13 11:12 t By chinapubmed

你可以用debug那个调试一下，看看怎么回事！/usr/local/xunsearch/sdk/php/util/XSDataSource.class.php

109.RE: 1.1.2的自定义字典无法使用

发布时间：2010-05-25 12:05 t By 逆雪寒

...756194'] 我用IE8在您的网址试了非常多次的强制刷新，MS都是正常的。但用FF确实不正确(而且是一直不正确）。。。我猜到原因所在了，你提交的是GET方法，FF自动在URL中显示汉字，所以可能导致传输编码出现问题。。。 [/quote...

110.在使用scws中遇到的怪问题，是否是bug，估计php缓冲区问题，恳求帮助

发布时间：2010-05-22 13:05 t By 逆雪寒

...码上有 flush () 强行刷新缓冲区。不过伙使用了。效果还是一样。偶尔得偶尔不得。但。我单独开个php文件。单独使用了 scws的demo代码。就没问题。恳求大家胡帮助。十分感谢

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

搜索