搜索

大约有 60 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.2935秒)

11.scws-1.1.9 发布,明确采用 BSD 协议;改进复合分词修正BUG等

更新时间:2011-12-28 13:12 t By hightman

2011-12-26: SCWS-1.1.9 Released. 1) 明确使用开源协议 New BSD License 发布新版本 2) 深度优化复合分词中的 SCWS_MULTISHORT 选项,更为合理有效,符合全文检索的需求 3) 测试脚本自动加载当前目录下的 dict_user.txt 文本词典 4) 修正...

12.想在用索引搜索时,输入的关键字分词该怎么做?

发布时间:2014-11-20 15:11 t By pbin

...? 文档里看到有个自定义词库的设置,然后根据文档使用了下,发现没达到效果。比如说,我想搜索拥有"味道恶心"这个词的文章,(我的文档库里面是有相关文章的了)搜索的时候出现了大多都是分成了"XX味道"+"XX恶心"的,所以...

13.Libscws C API 使用说明

更新时间:2010-12-30 22:12 t By hightman

...[/color][/size][/b] Libscws 代码是当前 SCWS(简易中文分词) 算法使用C语言编写的链接库,目前仅基于 Unix 族的操作系统,可能必须适当修改才能运行在 Windows 平台中。这套 scws 库没有外部扩展依赖,代码力争简洁高效,针对分词词典...

14.RE: 第四版遇到()和中英文混合分词的问题。

发布时间:2009-06-14 21:06 t By hightman

楼上你的情况是因为你对API使用正确, scws_get_result 应该循环调用 while ($words = scws_get_result($sh)) { foreach ($words as $word) { print_r($word); } } 此外, 繁体词库很完善, 缺词太多而且有一些词也正确

15.scws分词碰到连字符的词处理的问题

发布时间:2010-06-23 10:06 t By nickflyer

我在自己的网站上使用scws做分词,当文章中有类似PC-BSD之类有连字符的英文词时,都分成类“PC - BSD”,但这是个软件名,本应分开,英文中加-号的一般都视为一个词,按理说应分开的,有什么方法解决吗?

16.2007简易分词第4版(scws-0.1.x)体验

发布时间:2007-06-06 11:06 t By hightman

....hightman.cn/demo/scws/v48.php]UTF-8版[/url](词库较旧) 目前全部使用 *Unix* 系统下的标准C开发,全部采用自行设计的词典格式 (XTree 和 XDB) 完全需要依赖任何第三方库及数据库系统。统一编译成链接库 (.a或.so形式),在开发和使用...

17.项目配置文件详解

...符集范围涵盖服务端交互时的输入数据、输出数据,实际使用时索引文档、 检索服务器仍可重新指定字符集 ~~~ project.default_charset = UTF-8 ~~~ 3. ### 服务器连接参数 服务端连接参数的格式包含 3 种格式: 1. *端...

18.请问SCWS可以做英文分词么?

发布时间:2014-11-18 14:11 t By angelhater

我想对打断的英文做分词,utf-8,scws可以用么?应该下载哪个版本呢?PSCWS4 说是速度慢,推荐使用,而PSCWS23 仅支持GBK字符集

19.问个弱智的问题,知道会会收到回复?

发布时间:2011-09-19 13:09 t By strongfinger

用了网上的演示,这个分词系统挺好用的.但是本人是PHP新手,使用win7平台,hightman大侠提供的好像是一个中文分词引擎,知道怎么直接在我的php空间上激活。请问我自己要怎么实现演示页面的显示效果呢?

20.自定义词库如何使用

发布时间:2013-05-12 11:05 t By hq22

网页设计 分词后变成 网页设计 网页 设计 我想把网页设计就分为网页设计一个词,需要搜索出含有网页跟设计的内容。 我在dict_user.txt加入 网页设计 这个词,好像并没有效果,还是搜索出来含有网页跟设计的文档。

  • 时间不限
  • 按相关性排序