搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

71.RE: 分享一个dict_user.txt

发布时间：2012-02-22 11:02 t By hightman

感谢分享，不过英文单词不需要词库啊。

72.RE: 为什么我更新的索引会没有数据呢？

发布时间：2012-10-18 13:10 t By hightman

是不是你中文乱码了，试试搜索英文字符

73.RE: 词典格式疑问？

发布时间：2010-12-10 15:12 t By hightman

抱歉，这里没有讲清楚，英文，数字本身不需要设置会自动根据词界切割。这里说的是那些中英混合的特殊词汇，限制了夹带的字母只能1个或2个字符。比如：我有很多Q币，这里Q币你如果设为词，它可以被切出。再比如：我...

74.RE: 自定义的 txt 字典有关问题求助

发布时间：2010-04-10 01:04 t By hightman

最长的词16个汉字，250个英文字母。应该是你的词典做错了，比如字符集不匹配之类。生成词典要严格按照字段区分开，字段之间用区分，这说都有相关的说明，按说明操作应当没有问题。

75.分享一个dict_user.txt

发布时间：2012-02-21 16:02 t By Dull

全部是英文单词数据来源： twitter tumblr amazon alibaba flickr 等的标签原来多是词组形式改成了scws的单字形式没有附加任何属性也就是说全部使用默认属性参考 http://www.xunsearch.com/doc/php/guide/index.dict

76.RE: 怎样才能字母数字汉字组合按照词典分成一个词语呢？

发布时间：2013-07-03 16:07 t By hightman

这个改法我感觉不怎么好，没有普遍性。这样会导致中英文合的出问题。。。

以前的二元分词只支持英文，最后找到问题 public function getTokens($value, XSDocument $doc = null) { $terms = array(); for ($i = 0; $i < mb_strlen($value,"utf-8"); $i += $this->arg) { $terms[] = mb_substr($value, $i, $this->arg,"utf-8"); } return $terms; }...

78.RE: 请问一下，xdb与txt词库那个读取效率更高

发布时间：2013-06-29 22:06 t By hightman

后者是什么意思，举例说明一下吧。SCWS处理英文是按普通单词和数字的规则来做

79.修改SDK连接异常提示

更新时间：2012-04-24 14:04 t By zlhgo

...(C#' . $errno . ')'); [/code] 直接修改为相关错误信息呢(或用英文提示错误信息) [code]throw new XSException('由于目标机器积极拒绝，无法连接'. '(C#' . $errno . ')'); [/code] 修改原因：比如我用的是WIN系统，PHP提示的异常信息默认采用的是...

80.自定义字典的问题

发布时间：2011-03-14 22:03 t By zfzeng

...定义了个词库，可是一用这个词库，就分不出来，数字和英文除外。比如我定义“南瓜汤”，“番茄汤”作为一个词库，(测试用的，只放2个词在词库)，然后对这句话进行分词“我爱喝南瓜汤，番茄汤”进行分词，希望得到...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

搜索