搜索

大约有 40 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.2917秒)

21.XSTokenizerScws::getTops

...getTops(string $text, string $limit=10, $xattr='') $text string 待分词的文本 $limit string 在返回结果的词性过滤, 多个词性之间用逗号分隔, 以~开头取反 如: 设为 n,v 表示只返回名词和动词; 设为 ~n,v 则表示返回名词和动词以外的其...

22.xunsearch-1.4.8 (基于 xapian+scws 的开源中文搜索引擎,小问题优化改进)

发布时间:2013-12-11 15:12 t By hightman

...代码兼容性 2. 增加用户案例文档:USERCASE 3. 改进自定义分词器 XSTokenizerScws 接受参数作为复合等级 4. 升级 libevent 到 2.x 版 5. 修正中文 stopwords 不生效的问题 6. 取消恼人的 NODB(S#506) 错误提示 7. 新增获取文档匹配词表的接口 X...

23.关于 Xunsearch PHP-SDK

...采用 C/C++ 编写,索引设计基于著名而悠久的 [Xapian][1],分词采用 自主研发同样也是开源的 [SCWS分词][2],两者完美结合,理论上单个搜索库支持 40 亿条 记录。可编译运行于 Linux/FreeBSD 等各种 UNIX 类型的系统。 *Xunsearch PHP-SDK* 是...

24.同义词搜索

...一个单词有多种不同的形式,如:单复数、过去式和现在分词等。 而它们要传送的其实是同一种涵义。因此,对于纯英文的同义词记录会自动进行词根处理。 词根记录保存为大写字母 Z 开头的记录。例如: 设置 `find` 是 _s...

25.RE: [2012] SCWS-1.2.0 发布,BSD协议、支持自定义词库、PHP5.4

发布时间:2012-08-27 16:08 t By kill-all999

HM,您好,我目前使用自定义词库实现分词,但是通过scws_get_top5()方法获取数据的时候(字母+数字大于等于3个的时候也会返回)。求过滤方案。 $sh = scws_open(); scws_set_charset($sh, 'utf8'); scws_set_dict($sh, './dict.txt', SCWS_XDICT_TXT); scws_...

26.RE: xunsearch-1.4.5 (基于 xapian 和 scws开源中文搜索引擎,高扛压不死锁)

发布时间:2013-03-28 12:03 t By vus520

...现在的问题是想通过XSTokenizerScws来获取指定文本的自定义分词结果。sdk使用了github里最新的版本,词典格式由一楼所示,现在取出来的结果并不包含任何自定义词典的关键词,求解。[/code] [php] $text =

27.啥时候可以针对 split(|) 分割的字段进行分面搜索

发布时间:2014-07-23 10:07 t By xunsearch飞吧

分类分词 tokenizer = split(|) 这样的存进文档里,这样可以实现多个分类的 分面查询吗? 之前有篇帖子加 addTerm 或者 以split(|) 分割的2种方法,我试了下,不能解决分面搜索的统计结果! 没办法,又试了下,我结合以split(|) 分...

28.最新的主要变动

...化代码兼容性 - 增加用户案例文档:USERCASE - 改进自定义分词器 XSTokenizerScws 接受参数作为复合等级 - 升级 libevent 到 2.x 版 - 修正中文 stopwords 不生效的问题 - 取消恼人的 NODB(S#506) 错误提示 - 新增获取文档匹配词表的接口 [XSSearch:...

29.Xunsearch SDK for PHP

...Search(); $index = $db->getIndex(); // 如有必要,还可以获得 scws 分词对象 $scws = $db->getScws(); ``` #### 使用 xunsearch DebugPanel 为便于调试,还提供了一个 `hightman\xunsearch\DebugPanel` 对象,可以集成到 debug 模块中, 可在调试工具条和面板中显...

30.XSFieldMeta

...ieldMeta hasCustomTokenizer() 判断当前字段是否采用自定义分词器 XSFieldMeta hasIndex() 判断当前字段是否需要索引 XSFieldMeta hasIndexMixed() 判断当前字段是否需要在混合区索引 XSFieldMeta hasIndexSelf() 判断当前字段是否需...

1234
  • 时间不限
  • 按相关性排序