搜索

大约有 105 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0050秒)

71.RE: 分享一个dict_user.txt

发布时间:2012-02-22 11:02 t By hightman

感谢分享,不过英文单词不需要词库啊。

72.RE: 为什么我更新的索引会没有数据呢?

发布时间:2012-10-18 13:10 t By hightman

是不是你中文乱码了,试试搜索英文字符

73.RE: 词典格式疑问?

发布时间:2010-12-10 15:12 t By hightman

抱歉,这里没有讲清楚,英文,数字本身不需要设置会自动根据词界切割。 这里说的是那些中英混合的特殊词汇,限制了夹带的字母只能1个或2个字符。 比如:我有很多Q币,这里Q币你如果设为词,它可以被切出。 再比如:我...

74.RE: 自定义的 txt 字典 有关问题 求助

发布时间:2010-04-10 01:04 t By hightman

最长的词16个汉字,250个英文字母。 应该是你的词典做错了,比如字符集不匹配之类。生成词典要严格按照字段区分开,字段之间用区分,这说都有相关的说明,按说明操作应当没有问题。

75.分享一个dict_user.txt

发布时间:2012-02-21 16:02 t By Dull

全部是英文单词 数据来源: twitter tumblr amazon alibaba flickr 等的标签 原来多是词组形式 改成了scws的单字形式 没有附加任何属性 也就是说全部使用默认属性 参考 http://www.xunsearch.com/doc/php/guide/index.dict

76.RE: 怎样才能 字母数字汉字组合 按照词典分成一个词语呢?

发布时间:2013-07-03 16:07 t By hightman

这个改法我感觉不怎么好,没有普遍性。这样会导致中英文合的出问题。。。

77.RE: 二元分词问题

更新时间:2011-11-15 13:11 t By icebolt

以前的二元分词只支持英文,最后找到问题 public function getTokens($value, XSDocument $doc = null) { $terms = array(); for ($i = 0; $i < mb_strlen($value,"utf-8"); $i += $this->arg) { $terms[] = mb_substr($value, $i, $this->arg,"utf-8"); } return $terms; }...

78.RE: 请问一下,xdb与txt词库那个读取效率更高

发布时间:2013-06-29 22:06 t By hightman

后者是什么意思,举例说明一下吧。SCWS处理英文是按普通单词和数字的规则来做

79.修改SDK连接异常提示

更新时间:2012-04-24 14:04 t By zlhgo

...(C#' . $errno . ')'); [/code] 直接修改为相关错误信息呢(或用英文提示错误信息) [code]throw new XSException('由于目标机器积极拒绝,无法连接'. '(C#' . $errno . ')'); [/code] 修改原因: 比如我用的是WIN系统,PHP提示的异常信息默认采用的是...

80.自定义字典的问题

发布时间:2011-03-14 22:03 t By zfzeng

...定义了个词库,可是一用这个词库,就分不出来,数字和英文除外。 比如我定义“南瓜汤”,“番茄汤”作为一个词库,(测试用的,只放2个词在词库), 然后对这句话进行分词“我爱喝南瓜汤,番茄汤”进行分词, 希望得到...

  • 时间不限
  • 按相关性排序