搜索

大约有 20 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1008秒)

1.RE: 我想使系统自动的分词功能,可是只看到有接口

发布时间:2011-11-28 12:11 t By icebolt

如果只是想实现分词,为什么直接scws呢,何必xunsearch呢?

2.RE: 我想使系统自动的分词功能,可是只看到有接口

发布时间:2011-11-25 13:11 t By limingyao

...一个分割后的TAG都可以搜索到。 [/quote] 我需要的功能只是分词。和搜索木有关系。考虑另外安装scws了。。。

3.RE: 我想使系统自动的分词功能,可是只看到有接口

发布时间:2011-11-30 12:11 t By limingyao

[quote='icebolt' pid='282' dateline='1322453185'] 如果只是想实现分词,为什么直接scws呢,何必xunsearch呢? [/quote] 因为同一个系统里面,既有需要分词提取tag的地方,又有搜索,当然会出现此情况了。目前已安装scws来实现该功能...

4.daemon server(linux后台程序)和embed(库的形式嵌入程序中)

更新时间:2010-12-09 23:12 t By lauxinz

...。[b]当使本库做为 daemon server 时应当使 mem 方式,当只是 embed 调时应该使 xdb 方式[/b],将 xdb 文件加载进内存不仅占了比较多的内存,而且也需要一定的时间(35万条数据约需要0.3~0.5秒左右)。[/quote] 上文中daemon ser...

5.RE: scws与多线程

发布时间:2010-12-08 14:12 t By hightman

mblen 只是个指针,指向的是在 charset.c 中定义的全局变量,应当已经是共的了; 至于 mode 看需要吧,只是一个整型 ,如果你在不同线程中切分建议各自一个 mode ,除非你自己能确定它们的切词设置是共的(主要于保存...

6.mysql 其实支持中文全文检索的

发布时间:2010-05-14 10:05 t By xiaolan

只是。。。 没法而已。。 因为英文中都是空格进行分割的 不过如果将ft_min_word_len改为2, 然后在程序里将内容scws进行分词,然后存入数据库单独的字段里,空格分开,检索的时候, mysql的全文检索,可以检索到...

7.RE: 这个不支持英文词典和中英文混合词典啊

发布时间:2012-02-22 19:02 t By vanni

如果只要文章中有Linux出现就算是Linux相关文章的话,其实是不需要分词了,直接全文搜索Linux就好了。 只是SCWS目前看前来它的自定义词典不支持超过3个字,如果可以的话,可以通过自定义“Linux优化”来指定分词

8.RE: 求TF/IDF算法(官方的计算器没有作

发布时间:2013-05-22 13:05 t By hightman

TF/IDF值不会导致不到分词只是靠在一起时需要消岐才得到。你自定义词典不了要查查是什么别的原因。 通常问题: 1.词典写的字符集不对,比如把GBK当UTF-8了 2.词典更新后的修改时间由于某些原因比/tmp目录下生成的临...

9.Libscws C API 使说明

更新时间:2010-12-30 22:12 t By hightman

...定。当使本库做为 daemon server 时应当使 mem 方式,当只是 embed 调时应该使 xdb 方式,将 xdb 文件加载进内存不仅占了比较多的内存,而且也需要一定的时间(35万条数据约需要0.3~0.5秒左右)。 若此前 scws 句柄已经加载...

10.[2013] SCWS-1.2.2 发布,BSD协议、支持自定义词库、PHP5.4

更新时间:2013-07-11 21:07 t By hightman

...为原有功能,scws_add_dict 是新增功能,2者功能相当接近,只是 scws_set_dict 会把 scws handler 现存的词库表 清空,并设为当前的词库,而 scws_add_dict 只是将该词库添加到 scws handler 的词库表中,并优先使。 scws_add_dict 添加的...

12
  • 时间不限
  • 按相关性排序