搜索

大约有 19 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1950秒)

11.RE: XSTokenizerScws的一个使用问题

发布时间:2013-02-02 13:02 t By tisswb

...3'] 是你自己搞错了! “是一”本身不是词,只是因为二元结合法所以scws自动将其合成为一个词。 复合分词是对原本是词的长词情况处理的,比如”中国“可以切成”中“+”国“+”中国“ 你的问题必须是 [code] $tk = $...

12.http-scws(基于scws的http协议中文分词) 更新至2.0版

更新时间:2011-06-27 20:06 t By smallevil

... 5.可分词、提取高频词 6.支持GET与POST方式 7.支持短词、二元、主要单字、全部单字(基于scws功能) 8.支持标点过滤(基于scws功能) 简单测试结果: AMD 64位台式机四核CPU,程序加载词库后占用21M内存,使用10进程不间断请求请求...

13.scws_set_multi()函数的一个小问题....

发布时间:2010-12-06 22:12 t By lauxinz

...。mode 设定值,1~15。[b]按位与[/b]的 1|2|4|8 依次表示 短词|二元|主要单字|全部单字。缺省不复合分词。 返回值:无 错误:无 我记得符合 [b]| [/b]应该称为 [b]按位或[/b] 吧。另外这个函数的代码看了觉得有些不对劲: /* high...

14.英文模糊搜索问题

发布时间:2013-07-31 10:07 t By homingway

...显是根据空格分词的,所以达不到效果 2. 自己写的一元/二元分词器,某些情况下可以正常工作,不过有时会返回一些意想不到的结果,而且相关度看起来并不高,所以很困惑,最下方是我的具体代码实现,我试验的对象是英文...

15.关于扩展词库的问题

发布时间:2012-12-10 15:12 t By timeage

...[/b] 罗 铭 罗 大大 大 大 罗 [复合分词选项] 最短词 二元 重要单字 全部单字 加入自定义词库后结果为: 阿斯顿 阿斯 斯顿 阿 斯 顿 发 斯蒂芬 斯蒂 蒂芬 斯 蒂 芬 [b]罗铭 罗 铭 罗[/b] 大大 大 大 罗 我的自定义词典为: ...

16.【已解决】【感谢hightman帅哥的耐心解答,我是个人站长,要是我做起来了一定赞助您撒,

更新时间:2010-07-15 01:07 t By sulwan

...音主持培训中心高考暑假班招生啦 选项选择这些: 二元 清除标点 只看统计打钩 并写 2 官方结果明显正确,为啥我安装的不一样的呢? 在说第三点: 删除词条: 输入:陈凯歌是个帅哥吗 我限制了删除了 陈凯...

17.关于 SCWS 简易中文分词系统

更新时间:2013-01-10 16:01 t By hightman

...换算完毕大概是 1.5MB文本/秒) 测试过程中开启了散字自动二元聚合, 长词自动补切为短词, 开启了人名地名数字智能识别等功能, 基本上是针对搜索引擎专用的分词配置, 效果还是比较令人满意的!! [code] +--[scws(scws-cli/1.0.0)]----------+...

18.XSTokenizerScws

..., 支持 TXT/XDB 格式 XSTokenizerScws setDuality() 设置散字二元组合 XSTokenizerScws setIgnore() 设置忽略标点符号 XSTokenizerScws setMulti() 设置复合分词选项 XSTokenizerScws 方法明细 __construct() 方法 public void __construct(st...

19.Libscws C API 使用说明

更新时间:2010-12-30 22:12 t By hightman

...WS_MULTI_DUALITY | SCWS_MULTI_ZMAIN | SCWS_MULTI_ZALL 依次表示 短词|二元|主要单字|全部单字。缺省不复合分词。 [b]返回值:[/b]无 [b]错误:[/b]无 [b][color=#ff6600][/color][/b] [b][color=#ff6600]·void scws_set_debug(scws_t s, int yes);[/color][/b] [b]描述:[/b]设...

12
  • 时间不限
  • 按相关性排序