搜索

大约有 991 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0079秒)

351.分词问题

发布时间:2010-10-14 16:10 t By cp115

我在分词中没加$so->add_dict("dict.xdb",SCWS_XDICT_XDB); $so->add_dict("dict.txt",SCWS_XDICT_TXT); 这个情况下“云计算”分词如下:"云 计算"。我加了$so->add_dict("dict.xdb",SCWS_XDICT_XDB); $so->add_dict("dict.txt",SCWS_XDICT_TXT); 并在txt文件中加入 “...

352.RE: 三个问题需要求教

发布时间:2011-01-19 18:01 t By nftw

hightman: 补丁我试图去打了,但出现以下错误: patch -c libscws/scws.c scws.patch patching file libscws/scws.c Hunk #1 FAILED at 328. Hunk #2 FAILED at 684. 2 out of 2 hunks FAILED -- saving rejects to file libscws/scws.c.rej 补丁针对的版本是scws-1.5吗?

353.塔里木河的分词问题

发布时间:2013-06-08 12:06 t By wlx

测试代码如下,导致搜索:塔里木,会搜索不到结果。 require_once '/home/wlx/xunsearch/sdk/php/lib/XS.php'; $xs=new XS('westdc'); $tokenizer = new XSTokenizerScws; $text = '塔里木河下游浅层地下水变化的生态效应及生态系统健康评价研究项目的...

354.分词问题,不能分出单个字

更新时间:2013-01-07 15:01 t By rocl

麻烦看下: 例如: 跑马的时候非常的卡 跑马-的-时候-非常-的卡 最后分出来的"的卡"很明显是不正确的,请问下是否有办法解决, 应该是分成"跑马-的-时候-非常-的-卡" 感谢!!![hr] 我找到了楼主原先的一个回复: 建议把这...

355.RE: 英文数字组合字符串分词问题

更新时间:2014-05-14 10:05 t By hpxl

sdk/php/app/demo.ini配置 [php] [id] type = id [productsName] type = title tokenizer = scwsSplit [/php] 自定义字母、数字分词类 sdk/php/lib/XSTokenizerScwsSplit.php [php]

356.RE: 有关关联索引的问题

发布时间:2012-09-22 16:09 t By zspoplar

那如果要在后台php页面上建立索引,要如何操作呢?如下终端(ssh中执行的)语句:/usr/local/xunsearch/sdk/php/util/Indexer.php --rebuild --source=mysql://root:111111@localhost/dbo --sql="select * from user" --project=sokc,怎么写php脚本(类似后台的东西...

357.RE: search时报错 ,请帮看看是哪的问题

发布时间:2012-12-29 17:12 t By hightman

你的这次搜索请求超时了默认是5秒吧

358.RE: 分词问题

更新时间:2010-10-14 21:10 t By hightman

这里需要用到 set_multi,不过鉴于该词先单字后多字,所以达不到“云“+”计算“的效果。 使用 txt 附加词典时请显式地先指定 xdb 词典,以便 txt 词典后生效。 $so->add_dict('dict.xdb', SCWS_XDICT_XDB); $so->add_dict('dict.txt', SCWS_XDICT_TXT); [c...

359.RE: 遇到一个分词错误的问题

发布时间:2014-02-27 15:02 t By robinjia

又一个分词错误“陈明真在《苍天有泪》中扮 演谁啊?求陈明真的个人介绍”分成"陈明真/nr 在/p 《/un 苍天有泪/n 》/un 中/f 扮演/v 谁/r 啊/e ?/un 求/v 陈明/nr 真的/d 个人/n 介绍/v",其中“陈明 真的"这里有误

360.scws-1.1.2 发布, 修正人名识别失败的问题

发布时间:2010-05-09 02:05 t By hightman

...目运作中,网友发现部分情况搜索结果不全。经仔细排查问题在于 scws 分词中。 当采用非内存模式的词典时,返回的查结结果中(word_st)...->flag的属性包含怕 SCWS_WORD_MALLOCED 与 SCWS_ZFLAG_SYMBOL 定义冲突,以至于被当作符号文字从...

  • 时间不限
  • 按相关性排序