搜索

大约有 30 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1984秒)

11.同义词搜索

同义词搜索 人类语言文化丰富,同一个意思有无数种不同的表达方式。因此,**同义词** 是全文检索中非常重要和必要的一项基础功能。从 `1.3.0` 版本起,`Xunsearch` 开始提供同义搜索搜索功能。 什么是同义词搜索 ------...

12.RE: 怎样才能 字母数字汉字组合 按照词典分成一个词语呢?

更新时间:2013-07-03 16:07 t By shuyinglee

我这个是简单的改动,就是注释掉了一段代码 [code] diff -ur scws-1.2.1/libscws/scws.c scws-1.2.1.changed/libscws/scws.c --- scws-1.2.1/libscws/scws.c 2013-01-11 10:39:28.000000000 +0800 +++ scws-1.2.1.changed/libscws/scws.c 2013-07-03 10:38:49.409846632 +0800 @@ -60,6 +60,9 @@ s->...

13.我对切词尝试做了下功能修改

更新时间:2013-12-27 20:12 t By linqingtao

.../ MAX_ALNUM_CUT是中英文混合的最多多少个数字或字母就作为一个单独的词 // 原代码默认是2 修改为了一个宏 // 这部分处理的是开头有数字或字母的情况 // 如 “ABC中国足球" 之类的结果 // 对于上面的词...

14.RE: 三个问题需要求教

更新时间:2011-01-17 16:01 t By hightman

1. un 是 unknown, 如果需要你可以自己添加一个”LG集团“的词,这样它会被当作一个整词。 通常 un 是指不存在于词库中的字词,对于你这个情况,你可以修改 libscws/scws.c 第 680 行把 attr_un 改为 attr_en 即可,如果需要严格一点可...

15.libscws 段错误的 bug 修正

发布时间:2007-07-05 09:07 t By hightman

在 scws.c 中,由于取词时使用一个 unsigned char 来记录分词的长度,存在特殊情况即通过 rules.ini 自动识别出来的词有可能超过 255 字,如全部连续的双字节数字或字母.超过 255 字后 这里的 j 将变得不正确可能导致 item-> 指向 NULL ,...

16.[2013] SCWS-1.2.2 发布,BSD协议、支持自定义词库、PHP5.4

更新时间:2013-07-11 21:07 t By hightman

...网友 hovea. 修正 phpext/ 中 scws_get_result() 参数解析里多了一个z 的问题,感谢网友(阿男)告知 修正 scws.c 中某些字符在ignore symbol设置下无效的问题 -- [b]scws-1.1.3 发布于 2010-09-15 [/b] 将 cli/ 下的工具程序命名下划线改成连...

17.项目配置文件详解

...配置文件详解 基础说明 ------- - 项目配置是一个 `Xunsearch` 项目的核心灵魂,非常重要,通常保存为 .ini 文件 - 以分号开头的行表示注释,空行直接被忽略不起任何作用 - 中括号包围的每个分区均为字段配置,字段个...

18.搜索建议和纠错

...在综合分析索引库内的词汇、用户搜索日志基础上建立了一个庞大的纠错体系,支持英文拼写 纠错、中文同音字纠错、拼音转换等。 使用这些功能都非常简单,直接调用 [XSSearch::getCorrectedQuery] 即可,该方法接受搜索语句 作为...

19.体验 DEMO 项目

体验 DEMO 项目 为了让您对 `xunsearch` 有一个初步的印象和了解,我们在这个章节,借助辅助工具 带您体验一下搜索和索引的操作。这里可能有很多内容您尚不熟悉,请不必感到惶恐, 只要跟着说明完成操作即可,后...

20.RE: [2010] SCWS-1.1.3 发布,支持文本词典实现自定义词库啦!!

更新时间:2010-11-13 10:11 t By snakeyasin

...zend_parse_parameters() -- [b]scws-1.1.2 发布于 2010-5-9[/b] 这是一个小bug修正版,修正在非内存模式词库时会导致人名识别失败的bug. -- [b]scws-1.1.1 发布于 2010-3-4[/b] 这是一个bug修正版,1.1.0 中存在内存泄露的重大bug。 -- [b]scws-1.1.0...

123
  • 时间不限
  • 按相关性排序