搜索

大约有 200 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1021秒)

71.RE: 遇到一个分词错误的问题

更新时间:2014-02-17 10:02 t By robinjia

行,我试试。另外,你认为应该说说怎么解决“武松杀”那个问题吗?[hr] 加了“一张”这个词后,确实解决了那个问题。

72.RE: 分词初试,结果

发布时间:2010-09-17 16:09 t By xiaowang19

事实上,我UTF-8的一直成功,GBK的就会出现那样奇怪的问题 今天我又再试了一下(GBK版本的),在Windows下,在文件保存的时候,选择编码“ANSI”,这样就会出现那样奇怪的问题了

73.求助:SCWS(简易中文分词) 基于HTTP/POST的分词 API 使用说明

发布时间:2013-06-30 18:06 t By laiqn

...新手,对于php只懂一些皮毛,现在想使用 SCWS(简易中文分词) 基于HTTP/POST的分词的API 但是知道怎么调用,我用这个方式调用API,结果显示在网页上,我要如何调用才能将结果获取下来呢?比如我能将结果直接存在一个变量中...

74.RE: 遇到一个分词错误的问题

发布时间:2014-02-11 14:02 t By robinjia

知道还有没有其它更好的解决办法?能改代码,也必须保留武这个姓。正在考虑加一条规则,可是我懂那些词性语法规则的运作原理。

75.RE: 如何获取到分词对应的id

发布时间:2011-01-30 13:01 t By hightman

存在于词库中的所以没有idf啊,你说的是idf吗?

76.请问scws分词如何分出“四个字的词”呢?

更新时间:2013-05-24 02:05 t By zouhc

请问scws分词如何分出“四个字的词”呢? 目前只要超过三个就被拆分成两个,比如我要拆分 “2013春夏汽车新款” 中“2013春夏”怎么弄呢? 词典中我添加了“2013”、“春夏”、“2013春夏”,就是拆分出“2013春夏”。求...

77.请问scws分词如何分出“四个字的词”呢?

更新时间:2013-05-24 02:05 t By zouhc

请问scws分词如何分出“四个字的词”呢? 目前只要超过三个就被拆分成两个,比如我要拆分 “2013春夏汽车新款” 中“2013春夏”怎么弄呢? 词典中我添加了“2013”、“春夏”、“2013春夏”,就是拆分出“2013春夏”。求...

78.RE: 在搜索一个汉字时,总会出现搜索结果全甚至没有的情况

发布时间:2014-12-25 10:12 t By hightman

这是正常情况,分词的机制决定的。通常讲,搜索单字是有意义的,一定有这个需求的话需要自己修改分词引擎让它支持拆为单字。 具体看 XSTokenizerScws 这节,可以自行扩展然后通过 setMulti 方法索引单字

79.数字汉字混合分词的困扰

发布时间:2014-04-20 17:04 t By 漫步云海

带阿拉伯数字的节日 如”51劳动节“ 只能分出”劳动节“,只要数字在前面就识别出来,同时也很奇怪如果这些数字大于百位数 如”2014劳动节“ 就能分出2014和劳动节,最终想要”61儿童节“=61+儿童节 的效果,大神求助。。...

80.RE: 请问scws分词如何实现优先级

发布时间:2011-05-27 13:05 t By linda0725

我测试了好像仅仅提高tf值可以的吧?应该跟IDF值有关系吧?

  • 时间不限
  • 按相关性排序