搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

71.RE: 分词不对

发布时间：2010-04-26 16:04 t By hightman

一个快速解决办法在 rules.ini 及 rules.utf8.ini 的 v + v = 10 之后添加以下一行 q + vn = 10 即可

72.RE: 词典格式疑问？

发布时间：2012-02-22 19:02 t By vanni

为什么不能定义超过3个中文的词呀。（自定义词典使用的是UTF8格式）比如我定义 “相宜本草” ，但是没有用！

73.RE: 如何去除无用的词？

发布时间：2013-05-02 12:05 t By darena

我用UTF8, 也是"我是中国人", 出来的正好只有"中国人"一个词

74.RE: 遇到一个分词错误的问题

发布时间：2014-02-10 10:02 t By hightman

rule.utf8.ini里那些调节是通过常用词性组合来改变权重，这要求词典的词性必须十分准确才行

75.XSDocument::setCharset

...et){ $this->_charset = strtoupper($charset); if ($this->_charset == 'UTF8') { $this->_charset = 'UTF-8'; }} 设置文档字符集

76.二元分词问题

发布时间：2011-11-14 17:11 t By icebolt

project.name = demo2 project.default_charset = utf8 server.index = 8383 server.search = 8384 [pid] type = id [subject] index = both tokenizer =xlen(2) 二元分词只能对英文生效，对中文不生效同时急于需要一元分词，主要是做黑词筛选用，因为有...

77.RE: 布尔搜索问题

发布时间：2012-01-12 14:01 t By a114708367

[quote='hightman' pid='425' dateline='1326348954'] 限制是按字节来的，不是按字符数量啊。 /** * max length of query string for CMD_QUERY_ */ #define MAX_QUERY_LENGTH 80 [/quote] - -!我知道啊我的是utf8算完后共占77字节。

78.求助scws分词bug

发布时间：2014-04-22 15:04 t By zhoutian

在使用scws分词的时候，如果输入40多个“卡”字，最后分出来的那个词少了一个字节，就是说在utf8下原本3字节的一个“卡”字，变成了两个字节，形成了一个乱码。在线测试也会出现这种情况，大家怎么解决啊？？？

79.XSDatabasePgSQL::setUtf8

setUtf8() 方法 public void setUtf8() 源码: sdk/php/util/XSDataSource.class.php#L600 (显示) public function setUtf8(){ pg_set_client_encoding($this->link, 'UTF8');} 将输出字符集设置为 UTF-8

80.RE: 搜索问题

更新时间：2012-10-25 13:10 t By hightman

...几种办法： 1. 你把词典删除就可以搜索单字了。etc/dict.utf8.xdb ... 2. 或者要强制检索单还可以考虑修改C代码的部分，修改 src/import.h #define DEFAULT_SCWS_MULTI 3 把 3 改为 15 然后重新编译并重建索引就可以了 3. 用...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索