搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

141.libscws的问题

发布时间：2009-12-02 16:12 t By nftw

...DME中提供的例子对 "我是一名中国的程序员"这句话，进行分词，代码如下: [php] #include #include #include #include int main(int argc, char *argv[]) { scws_t s; scws_res_t res, cur; char *text;// = "Hello, 我名字叫李那曲是一...

142.RE: xunsearch安装成功，索引也显示成功，但是无法搜索

发布时间：2013-08-23 12:08 t By boxshadow

...ype = title tokenizer = full 求指点 [/quote] type=title的貌似分词必须用默认的吧 tokenizer = full 这个去了 [/quote] 好我先试试

143.关于扩展词库的问题

发布时间：2012-12-10 15:12 t By timeage

...生的词库对‘阿斯顿发斯蒂芬罗铭罗大大罗’这段话进行分词其中结果为：阿斯顿阿斯斯顿阿斯顿发斯蒂芬斯蒂蒂芬斯蒂芬 [b]罗铭罗罗铭铭罗[/b] 罗铭罗大大大大罗 [复合分词选项] 最短词二元重要单字 ...

144.XSTokenizerScws::setDict

...fpath); unset($this->_setting['add_dict']); return $this;} 设置分词词典, 支持 TXT/XDB 格式

145.SCWS切分的字符串是否有长度限制？

发布时间：2010-08-18 18:08 t By wrongway

在linux下装了scws1.1.2，并且装了php5的扩展，但是发现在分词时对于较长的字符串会自动截取前多少个字符进行切分，不知这是不是一个BUG？

146.构建搜索语句

...部默认采用 `AND` 规则，也就是说要求列出来的关键词（分词之后）全部匹配，如果您通过 [XSSearch::setFuzzy] 开启了模糊匹配，那么相当于采用 `OR` 规则，只要其中一个关键词匹配即可。刚刚说的这种搜索的是索引数据库的“混...

147.XSTokenizerScws::addDict

...CWS_SET, XS_CMD_SCWS_ADD_DICT, $mode, $fpath); return $this;} 添加分词词典, 支持 TXT/XDB 格式

148.RE: [2012] SCWS-1.2.0 发布，BSD协议、支持自定义词库、PHP5.4

发布时间：2012-08-27 16:08 t By kill-all999

HM,您好，我目前使用自定义词库实现分词，但是通过scws_get_top5()方法获取数据的时候(字母+数字大于等于3个的时候也会返回)。求过滤方案。 $sh = scws_open(); scws_set_charset($sh, 'utf8'); scws_set_dict($sh, './dict.txt', SCWS_XDICT_TXT); scws_...

149.编写第一个配置文件

...为了按版块检索，我们必须对它进行索引，而它也不需要分词，所以分词器用内置的 `full`。 - `tid` 内容也是数字的主题ID，我们暂不考虑按主题搜索，所以不需要索引，也没有排序等要求，所以只要当作普通字段存储下来即可...

150.RE: 能否提供字典dict.xdb的生成程序

发布时间：2009-06-28 21:06 t By hightman

...实上应该针对地名名词(含缩写,别名)建立词库, 然后将其分词, 提取关键字进行比较, 如果相同即可视为相同. 比如同样是 xx市, 有些人可能只写 xx 而没写市

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索