搜索

大约有 546 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1003秒)

71.两种或以上的分词如何建索引,谢谢

更新时间:2014-05-04 17:05 t By binny_w

... 比如我有这样的需求: 对标题的每个字作索引,再对SCWS分词作索引, 如“快乐大本营”,则有[‘快’, ‘乐’, ‘大’, ‘本’, ‘营’, ‘快乐’, ‘大本营’]7种结果, 这种自定义的分词器如何写? 谢谢, 我试过S...

72.配置文件的困惑

发布时间:2012-03-16 17:03 t By 张十三

tokenizer 分词器 默认为 default 采用内置的功能强大的 scws 分词,适合绝大多数字符串字段。也可以指定自定义分词器,格式为 name 或 name(arg) 两种形式,其中 name 是分词器名称,arg 则是传递给分词器构造函数的参数。自定义分词...

73.RE: 分词初试,结果不对

更新时间:2010-09-16 17:09 t By xiaowang19

...et_dict(ini_get('scws.default.fpath') . '/dict.utf8.xdb'); 再次运行,分词正确了[hr] 不过,又出现了奇怪的问题,我在原来的测试文本后面随便加了两个字母,分词又不对了。我继续增加字母,有时候对,有时候不对。(GBK版本)

74.RE: 如何获取到分词对应的id

发布时间:2011-02-14 12:02 t By michael

...。 如,一篇文章标题为:我是中国人,假设该文章id为1 分词后,有'中国',‘中国人’,如果每个分词有唯一的id对应,假设‘中国’=》1,'中国人'=》2 那么保存关联就成了 1(文章id)=》1(词组id) 1(文章id)=》2(词组id) ...

75.英文与数字组合词分词错误

发布时间:2014-04-20 16:04 t By tenjin

scws分词时出现这样的情况,英文字母与数字组合分词时,若词的前面或后面有标点符号,则英文字母和数字将会被拆分开,不知道是什么原因?有没有解决的办法? ./scws -c utf8 -i mp3 mp3 +--[scws(scws-cli/1.2.2)]----------+ | TextLen: 3...

76.如何获取到分词对应的id

发布时间:2011-01-30 11:01 t By michael

安装scwc后,可以进行分词,但返回格式里没有对应词的id,这样我就不能拿词id查询对应的文字id 难道我还要拿分词再查找对应的词库来获取id?这样就太慢了,估计不是这样做的,不知道大家怎么解决这个问题的。 [php] Array ( ...

77.RE: 我想使用系统自动的分词功能,可是只看到有接口

发布时间:2011-11-30 12:11 t By limingyao

[quote='icebolt' pid='282' dateline='1322453185'] 如果只是想实现分词,为什么直接用scws呢,何必用xunsearch呢? [/quote] 因为同一个系统里面,既有需要分词提取tag的地方,又有搜索,当然会出现此情况了。目前已安装scws来实现该功能...

78.RE: 英文数字组合字符串分词问题

更新时间:2014-05-14 10:05 t By hpxl

sdk/php/app/demo.ini配置 [php] [id] type = id [productsName] type = title tokenizer = scwsSplit [/php] 自定义字母、数字分词类 sdk/php/lib/XSTokenizerScwsSplit.php [php]

79.如何在虚拟服务器上使用分词功能!?

发布时间:2013-06-23 23:06 t By johnbaby

我之前测试都是在自己的电脑上,可以安装SCWS的插件,但是我现在想把网站移植到都网络上,才发现虚拟服务器没有办法安装分词插件,那我还能有什么办法呀? 非常感谢!!

80.RE: 遇到一个分词错误的问题

发布时间:2014-02-27 15:02 t By robinjia

又一个分词错误“陈明真在《苍天有泪》中扮 演谁啊?求陈明真的个人介绍”分成"陈明真/nr 在/p 《/un 苍天有泪/n 》/un 中/f 扮演/v 谁/r 啊/e ?/un 求/v 陈明/nr 真的/d 个人/n 介绍/v",其中“陈明 真的"这里有误

  • 时间不限
  • 按相关性排序