搜索

大约有 60 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0072秒)

21.RE: scws自定义词库可否自定义词性?

发布时间:2012-05-03 15:05 t By hightman

1. 需要重启 xs-searchd 2. 只读取 dict_user.txt 3. 系统的同时生效,但 dict_user.txt 优先级更高 4. 词性完全可以自定义,但最多 2个字节

22.RE: [2012] SCWS-1.2.0 发布,BSD协议、支持自定义词库、PHP5.4

发布时间:2012-08-27 16:08 t By kill-all999

HM,您好,我目前使用自定义词库实现分词,但是通过scws_get_top5()方法获取数据的时候(字母+数字大于等于3个的时候也会返回)。求过滤方案。 $sh = scws_open(); scws_set_charset($sh, 'utf8'); scws_set_dict($sh, './dict.txt', SCWS_XDICT_TXT); scws_...

23.[特别提供] 纯PHP编写的sqlite词典工具!!

更新时间:2010-07-08 22:07 t By limaoxiang

...租的服务器,windows环境),所以我只能用scws23了,但是词库我希望自己修改添加,但是XDB,这个格式我用了hightman提供的导入导出工具,就像[url=http://www.hightman.cn/bbs/showthread.php?tid=636]本网站的PHP的XDB导入导出工具[/url]里面提到...

24.[2013] SCWS-1.2.2 发布,BSD协议、支持自定义词库、PHP5.4

更新时间:2013-07-11 21:07 t By hightman

2010年,scws 加上了翘首以盼的删减词库功能,该功能通过变通的办法解决,并非直接修改核心词库。下面详细介绍一下 scws-1.1.x 的更新日志及用法举例(示例以PHP扩展语言为例)。 最新版下载地址:[url]http://www.xunsearch.com/scws/do...

25.自定义 SCWS 词库

自定义 SCWS 词库 如之前所说,我们所有的索引分词器默认为 scws,这也是我们开发的开源分词系统, 内置的词库基本上能满足绝大多数应用。但总有例外,这也就是即将说的如何自定义词库。 全局自定义词库 -----...

26.关于扩展词库的问题

发布时间:2012-12-10 15:12 t By timeage

问题1:使用原生的词库对‘阿斯顿发斯蒂芬罗铭罗大大罗’这段话进行分词 其中结果为: 阿斯顿 阿斯 斯顿 阿 斯 顿 发 斯蒂芬 斯蒂 蒂芬 斯 蒂 芬 [b]罗铭罗 罗铭 铭罗[/b] 罗 铭 罗 大大 大 大 罗 [复合分词选项] 最短词 二...

27.自定义词库用不了。非常不解啊。。

发布时间:2011-10-21 16:10 t By ci169

# mydict_utf8.txt 我是新增词 爆红 再试一个 [php] $text = '最近撑腰体爆红网络我是新增词再试一个'; class scws { public $so; function get_microtime() { list($usec, $sec) = explode(' ', microtime()); return ((float)$usec + (float)$sec); } ...

28.RE: 对医院的分词不太理想

更新时间:2010-09-07 18:09 t By hightman

杯具的分词词库和规则集导致这个结果, 稍后我看能不能简单调整一下规则集来获得比较好的效果。 查到原因了,是因为词库里居然有个错误的词叫“民医院”!! 建议删除该词重新生成词典或,写一个附加词典标记为删除。...

29.RE: [2010] SCWS-1.1.5 发布,修正一些BUG,支持文本词典实现自定义词库啦!!

发布时间:2011-03-08 19:03 t By binux

自定义词库有些词无效。。 有的是3个以上的,有些是4个以上的,不定。。 ubuntu linux环境,自编译安装 比如顶置的例子我这里是这样的 ; dict_extra.txt 我是新增词 2.0 再试一个 1.0 1.0 @ ; 以下词为删除项 删除 ...

30.RE: 请问一下,xdb与txt词库那个读取效率更高

更新时间:2013-06-29 23:06 t By 阿弟2013

我举个例子吧 下面是用csws分词的结果,明显csws把email,网址给拆开了,还有标签没有去除,但是中文词是正确的分开了 postgres=# SELECT to_tsvector('zw_simple','pgsql中国社区论坛 http://www.pgsqldb.org:8079 chenaishen@263.net'); ...

  • 时间不限
  • 按相关性排序