[quote='bigxu' pid='7789' dateline='1399872014'] 我也碰到过这个问题,是加了一个品牌字段,并且增加了权重。 [/quote] 。。。嗯,明明是一个已定义的词语,非要拆分了弄出一些不相干的结果。。。咋办啊
...tp://www.hightman.cn/demo/scws/v48.php[/url] 在我服务器测试时候,分词结果与你上面显示的分词结果完全不对 请问是什么原因? [[i] 本帖最后由 amyding 于 2008-8-21 11:39 编辑 [/i]]
问题:我在PPC等处理器上测试scws,发现都不能正确分词。 例如将“乒乓球拍卖完了”分词后结果为: WORD: 乒/un (IDF = 0.00) WORD: 乓/un (IDF = 0.00) WORD: 球/un (IDF = 0.00) WORD: 拍/un (IDF = 0.00) WORD: 卖/un (IDF = 0.00) WORD: 完/un (IDF = 0.00) W...
...在安装完 `Xunsearch` 后可以通过服务端内置的 scws[1] 实现分词, 而不需要另外再安装 scws 的 php 扩展。从 `1.3.1` 版本起,`Xunsearch` 的 PHP-SDK 中加入 [XSTokenizerScws] 类,可通过搜索服务端执行分词功能。 用法简单说明 ---------- 这...
富贵鸟(Y1W) 类似这样的名称分词的结果 却是 富贵 鸟(Y1W) 最关键的 Y1W 没有被分出来。 而且 六灯夜视D502 这样的名称 也只能分出 中文, 英文和数字没有被分出来,是为什么?请教高手。 我用的是SCWS 扩展 PHP 5.2.x 版二...
...33cc]0. 概述[/color][/size][/b] Libscws 代码是当前 SCWS(简易中文分词) 算法使用C语言编写的链接库,目前仅基于 Unix 族的操作系统,可能必须适当修改才能运行在 Windows 平台中。这套 scws 库没有外部扩展依赖,代码力争简洁高效,针对...
我知道我的问题出在哪了,我把这个文件存储为UTF8格式的文件就好了,输出结果就正常了。
分词结果是: 我爱/n 吃/v 康师傅/nz 牛肉面/n [hr] 我喜欢吃康师傅牛肉面 分词也有问题. 我喜欢/n 吃/v 康师傅/n 牛肉面/n[hr] 大概知道什么原因了,我爱,我喜欢都在词库中标注为名词n 我爱 14.71 4.59 n 我喜欢 14.90 4.82 n 请...
开始一直在取舍,最后敲定了scws 经过部分测试,scws的分词还是比较准确的, 当然还是需要大量的数据测试, 以及一段时间的试运行才会有更好的结果。 就是社区稍显冷清。。呵呵 新项目内部命名为super.maria 。 策划了有一...