搜索

大约有 7 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0057秒)

1.RE: 官方和提供的下载不一样,并且官方实例还写了错误代码

更新时间:2010-07-15 01:07 t By sulwan

我说您写错的实例是说的,您添加自定义词库那里,您多写了一个t,[hr] 您说的我都检查了,没有错,但是就是分词不对,我下的都是您最新版本的,您自己看看是不是词库提供错了呢?分词真的不对。

2.RE: 官方和提供的下载不一样,并且官方实例还写了错误代码

发布时间:2010-07-15 01:07 t By sulwan

...东西,对于索引要求比较高,墓前采用的办法是: SCWS分词,sphinx索引,减少索引,和增加的精确度,所索引专门提炼出来独立的数据库!

3.RE: 请教:关于地市信息的分词结果,如何更准确?

发布时间:2010-09-26 20:09 t By hightman

由于词库太大干扰所致,建议可以附加一个小词典(目的是删除这些无用词汇,以下我写出来作参考,把下面的文字存成dict.txt,然后在原有的set_dict之后加上 scws_add_dict(s, 'path/to/this_ad_dict.txt', SCWS_XDICT_TXT); 这样使文本词典生效. ...

4.RE: 为什么不提供历史版本的下载呢

发布时间:2011-09-17 01:09 t By hightman

每次更新都是期望改进,而不是倒退呵。 1.1.2 目前已经放入 [url]http://www.ftphp.com/scws/down/scws-1.1.2.tar.bz2[/url] 供下载。 您说的 1.1.2 在分词效果上比 1.1.8 还要好,可否指出哪几个实例

5.使用自定义词库的时候,部分词会丢失

更新时间:2014-04-18 17:04 t By tianly

...是SCWS-1.2.2 我用自己的词库替换了dict.utf8.xdb,然后尝试分词“朝鲜近日播放的一个纪录片中,发现”,发现“纪录片中”在分词结果中丢失了 Array ( [word] => 朝鲜 [off] => 0 [len] => 6 [idf] => 0 [attr] => @ ) Array ( [word] => 近日 [off] => 6 ...

6.Libscws C API 使用说明

更新时间:2010-12-30 22:12 t By hightman

...33cc]0. 概述[/color][/size][/b] Libscws 代码是当前 SCWS(简易中文分词) 算法使用C语言编写的链接库,目前仅基于 Unix 族的操作系统,可能必须适当修改才能运行在 Windows 平台中。这套 scws 库没有外部扩展依赖,代码力争简洁高效,针对...

7.[2013] SCWS-1.2.2 发布,BSD协议、支持自定义词库、PHP5.4

更新时间:2013-07-11 21:07 t By hightman

...使用开源协议 New BSD License 发布新版本 2) 深度优化复合分词中的 SCWS_MULTISHORT 选项,更为合理有效,符合全文检索的需求 3) 测试脚本自动加载当前目录下的 dict_user.txt 文本词典 4) 修正 scws.c 中 __PARSE_XATTR__ 宏的 BUG 导致 scws_get_t...

  • 时间不限
  • 按相关性排序