搜索

大约有 14 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0057秒)

1.RE: 三个问题需要求教

发布时间:2011-01-18 21:01 t By hightman

...国”+“人” ZALL 则所有文字,ZMAIN只会切出包含在词典中的字。(像那些切完是 /un 词性的字则不在ZMAIN中)

2.RE: 关于词典中的词性标注

发布时间:2009-08-05 06:08 t By akira

... dict_chs(t).utf8.xdb 導出,倒入資料庫處理時發現,有重複的字詞,這部份不多: chs 部份 : 禎, 银朱, 集科, 负电, 那霸, 无名肿毒, 燏, 无业, 安徽日报, 威兴我荣, 医疗器械, 一口吸尽西江水, 万乔 cht 部份: 那霸, 防禦率王, ...

3.RE: 遇到一个分词错误的问题

发布时间:2014-02-11 11:02 t By robinjia

...办法。 另一种是在看到武这个时,去判断这个字与后面的字是否组成一个词,如果是就跳过这个前缀检查。于是将scws.c的代码做了如下修改, 在890行 if ((r1->flag & SCWS_ZRULE_PREFIX) && (i < (zlen - clen))) { /* prefix, check...

4.请教一个新手问题

发布时间:2014-02-19 00:02 t By limw

中国国民党荣誉主席连战及随访 结果分词就把“连战及”分到一起了。 请问有解决办法嘛? 似乎两个字的名字,容易和后面的字分到一起。 我在论坛中看到了“武松杀”的帖子,但是貌似没有解决办法? 谢谢。

5.RE: 一个字符搜索不到数据,必须两个字符或以上才行

发布时间:2014-06-06 11:06 t By bigxu

全文检索的单位通常是“词”。通常认为,一个普通的字没有意义。 实在有必要你可以自定义分词器,按字索引。

6.高手请进,关于关键字的分词

发布时间:2010-12-19 09:12 t By stevenym

...这个分词技术,我想请问一下高手,在一个文章里有很多的字,比如“我,的,在,”这些单字,是不是也会被分出来,我想问的是,能不能取出像地名,人名,词语, 我想在一个网站中应该这些,请问有没有相关的案例可...

7.RE: 请教:rules.ini的使用方法

发布时间:2010-09-22 09:09 t By hightman

...字,并且这些字不在排除范围内的(一般不会用到名字里的字)那么就视为一个人名。大前提是这些都是散字,不在词库里。

8.「清除标点符号断词」错误回报

发布时间:2010-05-16 21:05 t By pudding

...使用「清除标点符号」来进行断词时,发现连非标点符号的字都被省略掉了。 在线演示的网页中也有一样的情况: http://www.ftphp.com/scws/demo/v48.cht.php 输入「館藏選擇與淘汰的原則」 并勾选「清除标点符号」 断词结果是「館...

9.【求助】无法正确搜索结果

发布时间:2012-03-04 15:03 t By flyxl

...误。 请换用另外的查询字词。 请改用较短、较为常见的字

10.麻烦站长解释一下“透过scws_get_result()取数据时自行排除单个字”

发布时间:2010-08-20 19:08 t By johnbaby

...装好了,用了很舒服。但有些分好的词都带有某些不重要的字。 如“我的秘密花园”里面的‘我’,‘的’我是都想去掉的。看了你的回帖,但是摸不着头脑是如何通过透过scws_get_result()取数据时自行排除... 还请站长指教...

12
  • 时间不限
  • 按相关性排序