搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

271.我搜索真的很慢，求大神帮看看是什么问题

发布时间：2013-08-12 09:08 t By zhuaijay

在 6,562,251 条数据中，大约有 1726139 条包含中国，第 1-10 条，用时：15.7350 秒。数据大概这么多,是用csv格式导入的。下面是我的配置文件 project.name = test_qw project.default_charset = utf-8 server.index = 8383 server.search = 8384 [docn...

272.易联网络在这里祝大家身体健康万事如意

发布时间：2008-04-16 07:04 t By pqrs940

...0m 不提供mysql 和 2级域名活http://www.78921.net/bbs/a/a.asp?B=203&ID=73 免费时间为一个月. 免费测试结束后.100个免费测试用户可以用论坛100点积分联系客服换得下一个月的免费空间使用权 (当你以积分换空间使用权后管理员删除1...

273.RE: 英文模糊搜索问题

发布时间：2013-07-31 15:07 t By homingway

[quote='hightman' pid='4418' dateline='1375253668'] 模糊搜索和空格不冲突吧。你单词内模糊就行了，比如按３个字母为单位建立？ [/quote] 非常感谢！我刚试了下，针对我的需求来说，对于人物英文名以3个字母为单位建立索引的确可...

274.关于addWeight()使用的一些注意（分享&讨论）

更新时间：2011-12-13 13:12 t By KnightE

...，所以我只能对所有分类升权，分类较多时味道不好； 3.当多种addWeight()组合时，发现顺序和我设想的还是有些差别，似乎一条记录的权重被多次addWeight()时不会叠加？这个问题我还会继续测试、分享。欢迎讨论、答疑。

...进行分词，分词结果为“Array ( [0] => 璋 [1] => 冪 [2] => 敤 [3] => segment [4] => 鏂 [5] => 规 [6] => 硶 [7] => 鎵 [8] => ц [9] =>  [10] => 璇 [11] => 嶆 [12] => 眹 [13] => 鍒 [14] => 囧 [15] => 壊 ) ”，这感觉好像是编码格式的问题，代码用的是gbk，我...

276.RE: 官方和提供的下载不一样，并且官方实例还写了错误代码

发布时间：2010-07-14 17:07 t By hightman

...调用了gbk的词典，把你的词典语句改为 dict.utf8.xdb 即可 3. dict_extra.txt 也必须是UTF-8编码 4. 删除词条，因为陈凯歌其实可能是因为人名关系导致切成词，可能会不受词典影响 5. 如果你非要用gbk 源码中 set_charset() 的参数就为 'gb...

277.RE: 填充测试数据的时候出现错误

发布时间：2011-09-19 17:09 t By tisswb

[quote='hightman' pid='17' dateline='1316280485'] ob_flush(): failed to flush buffer. No buffer to flush.(8) 多谢汇报，这是因为在UTF-8状态不会启用ob_Start做转码，下一版修正。 [/quote] 呃 b2的这个位置我使用gbk编码连接centos的后解决了输入问题...

278.拼音搜索时遇到的问题

更新时间：2012-12-26 12:12 t By HiLinz

...搜索到的影片中的关键词（芬芳、非凡、风范）高亮？ 3、搜索结果中如何把关键词按影片名中关键词出现的位置排序，如输入"ff"时， “那样芬芳”是分词后的第二个关键词（芬芳）时被找到，“非凡英雄”是分词后第一个关...

279.RE: 冒昧的问一下——怎么用tf和idf来计算权重？

发布时间：2012-02-22 18:02 t By vanni

...用 mydict.txt 文件内容如下： 1 相宜本草 2 雅漾 3 舒护 4 活泉水 # scws -A -d /hp/opt/scws/dict/default.utf8.xdb:/home/vanni/scws/mydict.txt -c utf8 "相宜本草洗面奶和雅漾舒护活泉水哪个好" 相宜/a 本草/nz 洗面奶/nz 和/c 雅漾/@ 舒护/@ ...

280.XSSearch::getAllSynonyms

getAllSynonyms() 方法 (自版本 v1.3.0 起可用) public array getAllSynonyms(int $limit=0, int $offset=0, bool $stemmed=false) $limit int 数量上限, 若设为 0 则启用默认值 100 个 $offset int 偏移量, 即跳过的结果数量, 默认为 0 $stemmed bool ...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

搜索