搜索

大约有 70 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1959秒)

51.[bogus] 大bug,add_dict会覆盖原来默认设置的dict,必须显式设置原dict

更新时间:2011-06-10 13:06 t By itlong

...->send_text($str); $sk = $so->get_result(); 这样,会得不到增加词库的效果, 必须: $so = scws_new(); $so->add_dict(LIB_DIR.'/scws/ext/dict.utf8.xdb');[b]//这里阿。。[/b] $so->add_dict(LIB_DIR.'/scws/phptool/dels.txt', SCWS_XDICT_TXT); $so->send_text($str); $sk = $so...

52.强烈建议支持词库里的词可以是纯英文单词

更新时间:2011-04-24 01:04 t By lauxinz

建议支持词库里的词可以是纯英文单词,虽然在分词时英文单词可以自动识别切分开,但在关键词提取和非法词过滤时却无法提取出或过滤掉纯英文单词。 比如:我要从一些商品名中提取一些品牌:adidas nike。。。对商品名分词...

53.RE: 三个问题需要求教

更新时间:2011-01-17 16:01 t By hightman

...词,这样它会被当作一个整词。 通常 un 是指不存在于词库中的字词,对于你这个情况,你可以修改 libscws/scws.c 第 680 行把 attr_un 改为 attr_en 即可,如果需要严格一点可以先判断一下 ch 是否为字母, 如以下: ...

54.RE: 自定义词时候出现问题 词太多apache死了

发布时间:2014-10-23 16:10 t By hightman

txt词库最好别在web上用啊,可以在命令行里用或转换为xdb吧。

55.RE: 10秒 10元 这样的想做为一个词要怎么配置

发布时间:2011-10-29 01:10 t By hightman

你要用自定义词库 编写一个 dict_extra.txt 里面写上每个词,一个一行 然后调用 add_dict 加入词典

56.英文数字组合字符串分词问题,已结贴。

更新时间:2014-05-14 10:05 t By hpxl

...url] 得到的结果为“华硕/主板/H/61/-/PLUS”。尝试过自定义词库,$prefix/data/项目名称/dict_user.txt 加入H61,但是不起作用,中文词汇是可以的。如果想分词结果中有H61,是不是只能自定义分词了?像这种商品的型号中很多类似的,...

57.RE: 1.1.2的 自定义字典无法使用

更新时间:2010-05-23 22:05 t By 逆雪寒

... $so->set_ignore(0); $so->set_multi(0); 就是不行. 我也怀疑是词库加不上的问题.这个问题太奇怪了. 不显式 set_dict 或 add_dict 那就很正常.[hr] 再次确定了下,显式加载字典后.总有点异常情况. http://116.252.185.149/fs360/web.php?words=%E9%82%...

58.RE: [特别发布] 纯PHP编写的xdb词典导入导出工具!!

更新时间:2009-07-26 12:07 t By hightman

...或者.xdb文件已损坏所导致的. 我发一份我这边正确导出的词库吧.(你可以从附件处下载) 而对于其中的 TF / IDF 则相应的表示该词的词频率系统以及逆词频率(表示词重要性), 你可以参考现有的词造一个系数. 而词性标注请看这...

59.RE: 官方和提供的下载不一样,并且官方实例还写了错误代码

更新时间:2010-07-14 21:07 t By sulwan

...会出错呢? 我直接在代码中修改那里呢? 上边指定的词库也是UTF8啊 您能否提供完整实例下载呢,直接查看您源码就是乱码,我要右键选择编码,完后复制的![hr] extension = scws.so scws.default.charset = utf8 scws.default.fpath = /usr/loc...

60.我对切词尝试做了下功能修改

更新时间:2013-12-27 20:12 t By linqingtao

... “ABC中国足球" 之类的结果 // 对于上面的词 如果词库中有 “ABC中国足球” “中国足球” // 旧代码切词结果是“ABC” “中国足球" // 修改后的切词结果是 "ABC中国足球” if (!(pflag & PFLAG_ALNUM) || zlen > MAX_AL...

  • 时间不限
  • 按相关性排序