搜索

大约有 200 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.4878秒)

51.xunsearch-1.3.1 (基于xapian/scws/php的开源中文全文搜索,新增分词SDK修正大量小BUG)

发布时间:2012-04-06 10:04 t By hightman

...发布 1.3.1 正式版,在 SDK 层面加入了许多用户诉求的 scws 分词接口,并修正了许多小 BUG,强烈建议所有用户升级到这个最新稳定版本。 [b]主要更新如下:[/b] 1. 增加基于搜索服务端的 XSTokenizerScws 便于直接使用 SCWS分词功...

52.添加新的分词无效

发布时间:2013-12-04 15:12 t By mengaifan

...增词库 $cws->set_ignore(true); //var_dump($cws); //添加中文分词 $cws->send_text($a); dict_extra.txt 已经增加了一行:享鑫 1 1 n,但是“享鑫金属”还是只有金属被匹配出来

53.两种或以上的分词如何建索引,谢谢

更新时间:2014-05-04 17:05 t By binny_w

... 比如我有这样的需求: 对标题的每个字作索引,再对SCWS分词作索引, 如“快乐大本营”,则有[‘快’, ‘乐’, ‘大’, ‘本’, ‘营’, ‘快乐’, ‘大本营’]7种结果, 这种自定义的分词器如何写? 谢谢, 我试过S...

54.scws 1.2.2的问题,为什么PHP调用c扩展和直接在c语言环境下得到的分词结果不一样?

发布时间:2014-02-24 10:02 t By 562586756

比如说“这本书”,在用C语言编译调用scws分词结果为"这/本书",但是编译为php扩展后调用,结果为"这本书",没有分掉,同一份代码同一个词库同一个规则集,为什么会出现不一样的结果?

55.RE: scws分词碰到连字符的词处理的问题

发布时间:2010-06-24 11:06 t By hightman

这个目录SCWS是按分开处理的, 主要是考虑了搜索实用性, 呵呵. 如果你要它连在一起, 得修改一下代码, 修改  libscws/scws.c 然后重新编译  [code] *** scws.c Sun May 9 01:16:11 2010 --- scws.c.condj Thu Jun 24 11:00:20 2010 *************** *** 326,342 **** ...

56.Libscws C API 使用说明

更新时间:2010-12-30 22:12 t By hightman

...33cc]0. 概述[/color][/size][/b] Libscws 代码是当前 SCWS(简易中文分词) 算法使用C语言编写的链接库,目前仅基于 Unix 族的操作系统,可能必须适当修改才能运行在 Windows 平台中。这套 scws 库没有外部扩展依赖,代码力争简洁高效,针对...

57.RE: 二元分词问题

更新时间:2011-11-15 11:11 t By hightman

需要 NEAR 位置信息的话,目前只能用内置的 scws 分词 scws 目前不能自定义词库,你必须把词库转换成 dict.utf8.xdb 一个统一的词库放进 $prefix/etc/ 才可以

58.RE: 对医院的分词不太理想

更新时间:2010-09-07 18:09 t By hightman

杯具的分词词库和规则集导致这个结果, 稍后我看能不能简单调整一下规则集来获得比较好的效果。 查到原因了,是因为词库里居然有个错误的词叫“民医院”!! 建议删除该词重新生成词典或,写一个附加词典标记为删除。...

60.RE: scws1.1.8为什么第一次都很慢。

更新时间:2011-10-24 14:10 t By ci169

大佬。你看看啊。不快啊。 [b]第一次提交[/b] 分词结果(原文总长度 94 字符) (这次分词结果不对,点击汇报) No. WordString Attr Weight(times) ------------------------------------------------- 01. 加分 nz 9.46(1) 02. 考试题 ...

  • 时间不限
  • 按相关性排序