搜索

大约有 80 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1947秒)

1.词性判断

发布时间:2013-09-28 14:09 t By river

自定义字典的时候,有一个字段是词性,这个该怎么判断,如果一个两个就好办,要是词语很多的时候,该怎么判断呢?要怎样用代码实现。

2.scws加载词库和规则集失败,使用者为啥不知道呢?

更新时间:2010-12-09 22:12 t By lauxinz

...坛很多帖子,其中不少都是词库没有加载上,却没有加以判断,结果发现分词结果不准确。 其实在scws文档中有这么一句话: [i][b]注:xdict_t 和 rule_t 分别是词典和规则集的指针,可判断其是否为 NULL 来判断加载的成功与失...

3.自定义“词性”

发布时间:2010-06-26 11:06 t By 逆雪寒

...。是否能自定义词性呢? 比如,现在我们的搜索, 先判断。如果搜的词 词性属于 产品类。那么我就让他跑产品库去搜索。 比如我定义 电脑 dn dn 就是我自定义的词性。这样我在scws 分词后,程序中可以用来判断。 ...

4.RE: 搜索的log

发布时间:2012-04-05 10:04 t By hightman

...先变通的如下方式处理: 在提取API后面自己再简单加个判断?现在新版 1.3.1 提供了 scws 接口,只要把这些黑词加到自定义词典,并取一个独特的词性,那么就可以用 XSTokenizerScws::hasWord() 的功能来判断是否包含黑词?

5.RE: 关于建立索引的疑问

更新时间:2012-03-06 01:03 t By coo

...处理的呃 我看官方文档说使用文档更新语句话他会先判断是否存在,存在就更新,不存在就添加,但是效率要比直接添加慢,因为有个判断过程

6.RE: 索引到一大半的时候出错退出,有没有办法继续?

发布时间:2011-10-25 09:10 t By hpxl

...来读取,比如每次10000条,就不会出现上面的php错误了。判断是不是某条数据是不是已经存在了,可以根据主键来判断是不是已存在,存在的跳过就可以了。例如: [php]$query = "id:1753"; $docs = $xs->search->search($query); print_r($docs);[/ph...

7.RE: 为什么程序消耗的内存越来越大

更新时间:2010-03-04 17:03 t By backluck

...你的监控方式是什么呢?最好能给出较为准确的数据以便判断。 [/quote][hr] 其实代码只是在文档的例子中添加了一个循环。 [quote='hightman' pid='3438' dateline='1267692528'] 是什么版本呢,新的版本应该是没有内存泄露了。 越来越...

8.RE: 麻烦站长解释一下“透过scws_get_result()取数据时自行排除单个字”

发布时间:2010-08-22 00:08 t By hightman

返回的时候根据长度排除啊,GBK的话单字就是2字节,很好判断啊,UTF-8三字节,但也能判断出是不是一个单个的汉字

9.scws_has_word没有得到部分指定词库中的词

更新时间:2011-12-06 16:12 t By michaele

... ,用scws_get_tops分出来的词中有这个词,但是scws_has_word却判断为不包含这个词。 但是大部分自定义词库中的词还是能用scws_has_word判断出来,而有些却有不可以,尤其是两个字的短词。 为什么呢? 我要怎么做?

10.libscws 段错误的 bug 修正

发布时间:2007-07-05 09:07 t By hightman

...得不正确可能导致 item-> 指向 NULL , 故加入以下红色部分判断. [code] static void _scws_mset_word(scws_t s, int i, int j) { word_t item; item = s->wmap[i][j]; /* hightman.070705: 加入 item == null 判断, 防止超长词(255字以上)unsigned char溢出 */ if ((i...

  • 时间不限
  • 按相关性排序