搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

101.有没有添加单个或多个词的函数？

更新时间：2010-07-28 18:07 t By backluck

正如之前的帖子描述，scws_has_word这个函数可以用来检测非法词。当前我的项目中禁止词是放在数据库里面（为了方便增删改），如果每次加载词典都要把禁止词写到临时文件，然后添加，觉得有点过于麻烦。是否可以提供添加...

102.XSTokenizerScws的一个使用问题

发布时间：2013-01-29 10:01 t By tisswb

... ( [off] => 0 [attr] => m [word] => 是一 ) ) [/quote] 我希望的结果是把两个字分成两个单字：‘是’，‘一’。而我在http://www.xunsearch.com/scws/demo/v4.php 进行测试的时候，却是我希望的结果...

103.搜索建议和纠错

...这一建议 echo "您是不是要找：\n"; foreach ($corrected as $word) { echo $word . "\n"; } } /** * 以下拼写示例则简化，并直接传入 Query 语句进行测试 * 您也可以例句用 `util/Quest.php demo --correct ` 进行测试 */ $search->getCorrectedQuer...

104.RE: [特别发布] 纯PHP编写的xdb词典导入导出工具！！

发布时间：2010-03-29 17:03 t By sdzhxl

最近在做个项目,用到了分词,找了一下,发现这个,很好. 遇到一个问题, 命令导出xdb到txt,只导出了这个 # WORD TF IDF ATTR 请问这是咋回事

...据做了int float操作然后在 [quote] $search->setQuery($array['word']); if(isset($array['sort'])) { $search->setSort($array['sort']); } $search->setLimit($array['limit'], $array['offset']); $search->search(); $array['sort'] = array('xxx' => true); 或者 $array['sort'] = ar...

106.XSTokenizerScws::hasWord

hasWord() 方法 public bool hasWord(string $text, string $xattr) $text string 要判断的文本 $xattr string 要判断的词性, 参见 getTops 的说明 {return} bool 文本中是否包含指定词性的词汇源码: sdk/php/lib/XSTokenizer.class.php#L382 (显...

107.修正utf-8版make_xdb_file.php的错误

发布时间：2011-06-09 09:06 t By itlong

...utf-8字符处理的，不能对中文(中英混合)字符进行mb_substr($word, 0, $len)切分,[u]mb_substr($word, 0, $len)切分中文会是乱码的。[/u] 所以要人为添加字符串处理涵数，针对utf-8。 [php] function msubstr($str, $start=0, $length, $charset="utf-8", $suffix ...

108.问一个关于线程安全的问题

发布时间：2011-05-07 18:05 t By lauxinz

... static data, DO NOT use two or more times in one line, Non-ThreadSafe */ word_t xdict_query(xdict_t xd, const char *key, int len); xdict_query() 不是线程安全的？看代码xdict_query()是线程安全的，并没有使用全局变量和静态数据，只是返回值可能是指向一...

109.RE: 在php cli 下测试自定义字典的更新问题

发布时间：2010-10-13 10:10 t By 逆雪寒

... 1.0 tq ------- Array ( [0] => Array ( [word] => 精武英雄 [off] => 0 [len] => 12 [idf] => 1 [attr] => tf ) ) 字典变了。读出来没变

110.mysql 其实支持中文全文检索的

发布时间：2010-05-14 10:05 t By xiaolan

...。因为英文中都是用空格进行分割的不过如果将ft_min_word_len改为2，然后在程序里将内容用scws进行分词，然后存入数据库单独的字段里，用空格分开，检索的时候，用mysql的全文检索，可以检索到结果，然后在再程序里面...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

搜索