搜索

大约有 546 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0051秒)

61.RE: 塔里木河的分词问题

发布时间:2013-06-09 13:06 t By hightman

因为“塔里木河”已经是个完整的词了,再细切也是“塔里+木河”。实在有必要可以自定义分词器或想办法将你要的词加入到索引中。

62.请教:关于地市信息的分词结果,如何更准确?

发布时间:2010-09-21 12:09 t By shallows

我使用scws的C版本提供的接口对省份、地市信息进行分词,发现分词的结果有时不是希望达到的结果。例如: 1 洛阳市廛河华林水席村 希望的结果为:洛阳市 廛 河 华林 水 席 村(词典中有洛阳市,市廛,河华,华林) 实...

63.英文数字组合字符串分词问题,已结贴。

更新时间:2014-05-14 10:05 t By hpxl

华硕主板H61-PLUS,想分词结果中包含H61。 通过 [url=http://www.xunsearch.com/scws/demo/v48.php]http://www.xunsearch.com/scws/demo/v48.php[/url] 得到的结果为“华硕/主板/H/61/-/PLUS”。尝试过自定义词库,$prefix/data/项目名称/dict_user.txt 加入H61,但是...

64.支持英文分词吗?和Sphinx有性能对比吗?

发布时间:2014-04-10 20:04 t By beyondbobo

支持英文分词吗?和Sphinx有性能对比吗?

65.求助scws分词bug

发布时间:2014-04-22 15:04 t By zhoutian

在使用scws分词的时候,如果输入40多个“卡”字,最后分出来的那个词少了一个字节,就是说在utf8下原本3字节的一个“卡”字,变成了两个字节,形成了一个乱码。在线测试也会出现这种情况,大家怎么解决啊???

66.RE: 英文与数字组合词分词错误

发布时间:2014-04-23 10:04 t By tenjin

C++版本和官网演示分词不一致。 ".mp3",在线演示切分成". mp3",C++版本 1.22切分为". mp 3";

67.请问SCWS可以做英文分词么?

发布时间:2014-11-18 14:11 t By angelhater

我想对打断的英文做分词,utf-8,scws可以用么?应该下载哪个版本呢?PSCWS4 说是速度慢,不推荐使用,而PSCWS23 仅支持GBK字符集

68.RE: 二元分词问题

发布时间:2011-11-16 11:11 t By hightman

...kenizer 类,然后根据自己需要生成 tokens 就可以了。 二元分词并不是直接分成N长的若干段,而是 ABCD => AB + BC + CD 你的作法会把 ABCD => AB+CD 这样搜索 BC 就搜索不到了。。。

69.ubuntu 64位无法分词

发布时间:2013-11-05 12:11 t By luopuya

ubuntu13.04是用amd64.iso在虚拟机里安装的 分词几乎都是un 而在另一个32位ubuntu上则正常 字典是完好的的xdb 顺便问下有无txt格式的字典下载,用scws_gen_dict生成不知道行否

70.RE: 遇到一个分词错误的问题

发布时间:2014-02-25 11:02 t By robinjia

又一个分词错误。将“你用余额宝吗?为什么有人讨厌余额宝?”分成了 你 /r 用 /v 余额 /n 宝吗 /nr ? /un 为什么 /r 有人 /r 讨厌 /v 余额宝 /nz ? /un

  • 时间不限
  • 按相关性排序