搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

131.RE: 无法打开类型为 xdb 数据文件是什么问题？

发布时间：2012-10-05 18:10 t By 1185520774@qq.com

...ict/dict.xdb` in D:\99dy\include\scws\dict.class.php on line 155[/code] 是什么原因？ [/quote] 我也遇到同样的问题了，配置都没问题的，哪位高手能帮忙解决一下吗？急用！ [/quote]看是不是路径问题。。。。

132.关于scws和词库的一些建议

更新时间：2011-04-23 21:04 t By lauxinz

建议支持词库里的词可以是纯英文单词，虽然在分词时英文单词可以自动识别切分开，但在关键词提取和非法词过滤时却无法提取出或过滤掉纯英文单词。比如：我要从一些商品名中提取一些品牌：adidas nike。。。对商品名分词...

133.libscws的问题

发布时间：2009-12-02 16:12 t By nftw

hightman您好：我大致用README中提供的例子对 "我是一名中国的程序员"这句话，进行分词，代码如下: [php] #include #include #include #include int main(int argc, char *argv[]) { scws_t s; scws_res_t res, cur; char *text;// = "...

134.按字段值分面搜索

...性。例如一本书包含主题、作者、年代等，而分面搜索是指通过事物的这些属性不断筛选、过滤搜索结果的方法，可以将分面搜索看成搜索和浏览的结合。如果您还是不清楚它的概念，敬请参阅[这篇文章][1]。适用情况 -----...

135.RE: XSTokenizerScws的一个使用问题

发布时间：2013-01-30 14:01 t By hightman

是你自己搞错了！ “是一”本身不是词，只是因为二元结合法所以scws自动将其合成为一个词。复合分词是对原本是词的长词情况处理的，比如”中国“可以切成”中“＋”国“＋”中国“ 你的问题必须是 [code] $tk = $tokenizer->s...

136.模拟xunsearch增量索引的方法

更新时间：2012-11-30 16:11 t By wish5115

...和删除时间大于这个值的数据，然后加入到索引库。如果是物理删除的，须记录删除日志。这个是根据我的情况写的，我由于里面没有删除时间，所以更新索引时记录了下已删除的id，而且添加数据时的默认创建时间和编辑时间...

137.对于分词的一些困惑

更新时间：2010-10-13 17:10 t By 逆雪寒

...词：北海365 365 就这两个词。然后我搜的时候是：北海365 这时候返回的分词却只有： 365 “北海”不见了如果我启动系统自带词典那么“北海”又就被分成一个词。但是我想明确的分词， “ 北海365”...

138.RE: 为什么程序消耗的内存越来越大

发布时间：2010-03-04 16:03 t By hightman

是什么版本呢，新的版本应该是没有内存泄露了。越来越大你的监控方式是什么呢？最好能给出较为准确的数据以便判断。

139.RE: 谁在windows下测试通过了，请给写个说明。谢谢了。我是这样做的，但是有错误。

发布时间：2010-10-30 20:10 t By hightman

你最好直接做一个输出 phpinfo 的页面,然后再在上面看真正生效的php.ini以及相关配置 extension_dir 等的值你这个情况多数是路径或PHP.INI位置不对

140.英文可以自定义词性吗？

发布时间：2013-08-30 05:08 t By mynoname

通常英文是不需要分词的，但很多时候词性是需要的，比如nike，dior这类品牌英文。目前默认词性都是en，有什么办法可否自定义词典来改变他的词性。还有个问题，就是纯数字的词性为什么是en呢，不是m? 望赐教。

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索