搜索

大约有 30 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1963秒)

11.关于扩展词库的问题

发布时间:2012-12-10 15:12 t By timeage

...分词选项] 最短词 二元 重要单字 全部单字 加入定义词库后结果为: 阿斯顿 阿斯 斯顿 阿 斯 顿 发 斯蒂芬 斯蒂 蒂芬 斯 蒂 芬 [b]罗铭 罗 铭 罗[/b] 大大 大 大 罗 我的定义词典为: 铭罗 1 0 n 罗铭 1 0 n 我...

12.RE: 1.1.2的 定义字典无法使用

更新时间:2010-05-23 22:05 t By 逆雪寒

谢谢 hightman 的回答. 不过我确定我市完全按照你说的做的 php.ini 是这样的配置 [scws] extension=scws.so scws.default.charset=utf8 scws.default.fpath=/usr/local/scws/etc 而php 是这样 //分词 $so = scws_new(); $so->set_charset('utf8'); // 这里没有...

13.这个不支持英文词典和中英文混合词典

发布时间:2011-12-29 16:12 t By conglei1981

很多应用不可能纯中文啊,总会掺杂一些英文啊中英混合啊。不支持定义词典使用英文会有很大局限性啊

14.RE: xunsearch-1.4.5 (基于 xapian 和 scws开源中文搜索引擎,高扛压不死锁)

发布时间:2013-03-28 12:03 t By vus520

... 我现在的问题是想通过XSTokenizerScws来获取指定文本的定义分词结果。sdk使用了github里最新的版本,词典格式由一楼所示,现在取出来的结果并不包含任何定义词典的关键词,求解。[/code] [php] $text =

15.“有空间”的分词有问题和扩充词典

更新时间:2013-05-18 14:05 t By lyjkensou

...但实际结果是“有空 间” 即使通过scws_add_dict()添加了定义的txt字典(里面只包含“空间 11.82 12.38”一行),仍然分不出“空间”这个词。 还有如何设置才能识别出网址和邮箱等格式? 另外关于scws-gen-dict,按照github上的...

16.最新的主要变动

...进优化代码兼容性 - 增加用户案例文档:USERCASE - 改进定义分词器 XSTokenizerScws 接受参数作为复合等级 - 升级 libevent 到 2.x 版 - 修正中文 stopwords 不生效的问题 - 取消恼人的 NODB(S#506) 错误提示 - 新增获取文档匹配词表的接口 [XSS...

17.对于分词的一些困惑

更新时间:2010-10-13 17:10 t By 逆雪寒

使用定义字典。完全忽略带的字典。 然后我在字典里面 分词 : 北海365 365 就这两个词。 然后我 搜的时候 是 : 北海365 这时候返回的分词 却只有: 365 “北海”不见了 如果我启动系统词典 那么“...

18.RE: [2010] SCWS-1.1.3 发布,支持文本词典实现定义词库啦!!

更新时间:2010-11-13 10:11 t By snakeyasin

...才行。 -- [color]新功能用法示例[/color] (php为例) -- 1. 定义词库,含新增核心库不存在的词汇及删除核心库存在词汇的功能 1) 创建相应字符集的词库文件 dict_extra.txt 2) TF/IDF 参考值查询,为方便大家我作了一个工具...

19.RE: [2010] SCWS-1.1.3 发布,支持文本词典实现定义词库啦!!

发布时间:2012-11-06 22:11 t By umland

...才行。 -- [color]新功能用法示例[/color] (php为例) -- 1. 定义词库,含新增核心库不存在的词汇及删除核心库存在词汇的功能 1) 创建相应字符集的词库文件 dict_extra.txt 2) TF/IDF 参考值查询,为方便大家我作了一个工具...

20.2007简易分词第4版(scws-0.1.x)体验

发布时间:2007-06-06 11:06 t By hightman

...试运行中。它在算法与写法上都有相当大的改进,支持定义规则的人名等专名动识别,也支持UTF-8/GBK等不同字符集。经评估测试分词准确率在 95% 左右,召回率有 92% 以上。 这套程序的开发其实很早就开始做基础工作了,...

123
  • 时间不限
  • 按相关性排序