搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

31.关于 SCWS 简易中文分词系统

更新时间：2013-01-10 16:01 t By hightman

SCWS 全称是 Simple Chinese Words Segmentation 即简易中文分词系统。 [url=http://www.xunsearch.com/scws][b][size=5][color=#FFA500]2010/01, scws-1.1.0 发布，支持加载文本词典，下载及介绍请进项目站点 http://www.xunsearch.com/scws[/color][/size][/b][/url] [url=http://w...

32.libscws 段错误的 bug 修正

发布时间：2007-07-05 09:07 t By hightman

在 scws.c 中，由于取词时使用一个 unsigned char 来记录分词的长度，存在特殊情况即通过 rules.ini 自动识别出来的词有可能超过 255 字，如全部连续的双字节数字或字母．超过 255 字后这里的 j 将变得不正确可能导致 item-> 指向 NULL ,...

33.项目配置文件详解

...，请将关联记录转换为搜索项目的新字段并设置对应的分词规则。字段设计很重要，请仔细根据需求创建，字段名建议和您的实际数据库字段一致。 1. ### 定义字段每个字段用一个区段配置来表示，中括号内的名字即为字...

34.scws-1.0.0 正式发布 (含php扩展及2文本词典)

更新时间：2010-01-29 13:01 t By hightman

...选] SCWS 是 Simple Chinese Words Segmentation 的缩写（简易中文分词系统）。它是一套基于词频词典的机械中文分词引擎，它能将一整段的汉字基本正确的切分成词，因为词是汉语的基本语素单位，而书写的时候不像英语会在词之间 ...

35.编写第一个配置文件

...为了按版块检索，我们必须对它进行索引，而它也不需要分词，所以分词器用内置的 `full`。 - `tid` 内容也是数字的主题ID，我们暂不考虑按主题搜索，所以不需要索引，也没有排序等要求，所以只要当作普通字段存储下来即可...

36.RE: [特别发布] 纯PHP编写的xdb词典导入导出工具！！

更新时间：2011-03-01 22:03 t By hit

...面的排序完全改变了目前的情况是我导出TXT在创建XDB 分词速度比之前慢了2倍这个问题很想知道原因T-T XDB->TXT这似乎是一个很难逆转或者是无法逆转的过程 (我只是感觉到导出文件的TXT可能有问题)或者创建的XDB文件有...

37.为何导出txt,里面内容不动在创建XDB之后速度变慢很多很多

发布时间：2011-03-03 00:03 t By hit

...面的排序完全改变了目前的情况是我导出TXT在创建XDB 分词速度比之前慢了2倍这个问题很想知道原因T-T XDB->TXT这似乎是一个很难逆转或者是无法逆转的过程 (我只是感觉到导出文件的TXT可能有问题)或者创建的XDB文件有...

38.RE: 请问一下，xdb与txt词库那个读取效率更高

更新时间：2013-06-29 23:06 t By 阿弟2013

我举个例子吧下面是用csws分词的结果，明显csws把email,网址给拆开了，还有标签没有去除，但是中文词是正确的分开了 postgres=# SELECT to_tsvector('zw_simple','pgsql中国社区论坛 http://www.pgsqldb.org:8079 chenaishen@263.net'); ...

39.RE: [2012] SCWS-1.2.0 发布，BSD协议、支持自定义词库、PHP5.4

发布时间：2012-08-27 16:08 t By kill-all999

HM,您好，我目前使用自定义词库实现分词，但是通过scws_get_top5()方法获取数据的时候(字母+数字大于等于3个的时候也会返回)。求过滤方案。 $sh = scws_open(); scws_set_charset($sh, 'utf8'); scws_set_dict($sh, './dict.txt', SCWS_XDICT_TXT); scws_...

40.按字段值分面搜索

...件做筛选搜索，支持分面的字段需要进行索引，而它的分词方式最好必须是 `full` 即整值索引。用法详细示范 ----------- 以论坛文章搜索为例，每篇文章均属于不同版块（字段为 fid）、不同的发表年份（字段为 year），我们需...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索