搜索

大约有 80 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.2917秒)

41.如何处理“小沈阳”这种模式的词句!?

发布时间:2010-10-28 10:10 t By johnbaby

...阳”无法查到相关信息。进到数据库一看。原来以前保存分词结果的时候。带有“小沈阳”的词句都被分成了这个模式: “小沈阳若在美国”:“小沈 阳若 在 美国”。而单独输入“小沈阳"作为关键字的时候,分词结果却是:...

42.scws-1.1.9 发布,明确采用 BSD 协议;改进复合分词修正BUG等

更新时间:2011-12-28 13:12 t By hightman

...用开源协议 New BSD License 发布新版本 2) 深度优化复合分词中的 SCWS_MULTISHORT 选项,更为合理有效,符合全文检索的需求 3) 测试脚本自动加载当前目录下的 dict_user.txt 文本词典 4) 修正 scws.c 中 __PARSE_XATTR__ 宏的 BUG 导致 scws...

43.RE: [HELP]xunsearch安装好了,搜索没有结果集。。。

发布时间:2011-10-27 16:10 t By hightman

...395'] 非常感谢...也在刚开始学习xunsearch xunsearch采用 scws 分词 xunsearch好像集成了 scws 对于分词 xunsearch 可以通过 XSTokenizer 扩展 我想问的是 既然是 集成scws 那么 1.有没有提供scws的api接口,实现短语分词功能 2.是否可以对scws...

44.RE: 为何导出txt,里面内容不动在创建XDB之后速度变慢很多很多

更新时间:2011-03-13 02:03 t By hit

...用的那种 于是就这样我用小工具创建的XDB比官方下载的分词速度慢 演示版的那个分词 0.06s 用我创建的XDB就到 0.09-0.1s了 我觉得比较奇怪~~ 一切都是按说明操作的 还有xdb没有增加新的词语和减少词语用的官方XDB导出的TXT

45.http-scws(基于scws的http协议中文分词) 更新至2.0版

更新时间:2011-06-27 20:06 t By smallevil

...只需一个命令即可使新词库生效 4.最大150K文本提交 5.可分词、提取高频词 6.支持GET与POST方式 7.支持短词、二元、主要单字、全部单字(基于scws功能) 8.支持标点过滤(基于scws功能) 简单测试结果: AMD 64位台式机四核CPU,程...

46.在 Xunsearch 使用 SCWS

...在安装完 `Xunsearch` 后可以通过服务端内置的 scws[1] 实现分词, 而不需要另外再安装 scws 的 php 扩展。从 `1.3.1` 版本起,`Xunsearch` 的 PHP-SDK 中加入 [XSTokenizerScws] 类,可通过搜索服务端执行分词功能。 用法简单说明 ---------- 这...

47.想在用索引搜索时,输入的关键字不被分词该怎么做?

发布时间:2014-11-20 15:11 t By pbin

想在搜索的时候,关键词按照自己的意愿来切分应该是要怎么做? 文档里看到有个自定义词库的设置,然后根据文档使用了下,发现没达到效果。比如说,我想搜索拥有"味道恶心"这个词的文章,(我的文档库里面是有相关文章的...

48.[特别提供] 纯PHP编写的sqlite词典工具!!

更新时间:2010-07-08 22:07 t By limaoxiang

...项目,希望更多的人能有用。 原因:我希望给网站提供分词功能,但是,我只能用php方式,也不能修改服务器的设置(合租的服务器,windows环境),所以我只能用scws23了,但是词库我希望自己修改添加,但是XDB,这个格式我用...

49.求救PSCWS4问题

发布时间:2010-07-21 10:07 t By FG2008

...s4.class.php'; header("Content-Type:text/html;charset=utf-8"); // 建立分词类对像, 参数为字符集, 默认为 gbk, 可在后面调用 set_charset 改变 $pscws = new PSCWS4('utf-8'); $pscws->set_ignore('yes'); $pscws->set_dict('E:/scws/etc/dict.utf8.xdb'); $pscws->set_rule('E:/scws...

50.PHP4版 简易中文分词(PSCWS) 第2/3版

发布时间:2007-06-06 09:06 t By hightman

[b][size=3]关于 PHP 版简易中文分词[/size][/b] 目前已经发布的PHP版分词有第2版和第3版,这两个版本的用法完全一样,主要区别在于分词的算法,前者采用正向最大匹配2级交叉消岐,而后者采用的是双向匹配综合消岐。并没有绝...

  • 时间不限
  • 按相关性排序