...2' dateline='1322453185'] 如果只是想实现分词,为什么直接用scws呢,何必用xunsearch呢? [/quote] 因为同一个系统里面,既有需要分词提取tag的地方,又有搜索,当然会出现此情况了。目前已安装scws来实现该功能。
原随 scws 一起发布的简体中文 xdb 词典存在部分问题,导致一些冷僻汉字不能做到散字自动二元,甚至被当做标点符号清除。 现已更新词典,修正该问题,强烈建议重新下载新词典。下载地址: [URL]http://www.ftphp.com/scws/download....
...自己加断点简单调试一下。 [/quote] 我知道,不能用于PSCWS23里的词典。可用于 SCWS-1.x.x 和 PSCWS4. 但是同样是XDB格式,我想导入导出PSCWS23下的XDB词典又怎么办呢?谢谢你的回答和免费提供学习。[hr] SCWS-1.x.x 和 PSCWS4 的分词词典...
...pid='255' dateline='1322196172'] 还是不明白! 你把这段文字用scws切割会有问题吗?如果你这段字是用空格或逗号分隔,那么你可以用 split 这个分词器啊。 搜索的时候搜索任何一个分割后的TAG都可以搜索到。 [/quote] 我需要的功...
...][/b] 1. 在线第2/3版综合演示 - [url=http://www.hightman.cn/demo/scws/demo.php]http://www.hightman.cn/demo/scws/demo.php[/url] 2. 全部下载包,只包括 .cdb 和 .txt 格式词典(cdb 若需要用于 php5 请自行转换词典) [url=http://www.hightman.cn/down/php-scws-v23....
...想分词结果中包含H61。 通过 [url=http://www.xunsearch.com/scws/demo/v48.php]http://www.xunsearch.com/scws/demo/v48.php[/url] 得到的结果为“华硕/主板/H/61/-/PLUS”。尝试过自定义词库,$prefix/data/项目名称/dict_user.txt 加入H61,但是不起作用,中文...
...把下面的文字存成dict.txt,然后在原有的set_dict之后加上 scws_add_dict(s, 'path/to/this_ad_dict.txt', SCWS_XDICT_TXT); 这样使文本词典生效. 其中词典格式为 词 tf idf attr (当attr为!表示删除该词) [code] 市廛 1 1 ! 河华 1 1 ! 阳道 1 1 ! 道南路 4 2 nz...
...eline='1244985795'] 楼上你的情况是因为你对API使用不正确, scws_get_result 应该循环调用 while ($words = scws_get_result($sh)) { foreach ($words as $word) { print_r($word); } } 此外, 繁体词库很不完善, 缺词太多而且有一些词也不正确 ...
SCWS-1.2.2安装后运行自带的测试脚本scws_test.php报错了: SimpleCWS::set_dict(): Failed to set the dict file。 检查过多次完全按照说明安装的。服务器环境是ubuntu 12.04 nginx php5.3[hr] 权限问题,更改权限可以了!
你好, 我使用scws-1.0.0_win32_php-5.2.x有以下問題: test.php: Warning: SimpledCWS::set_dict() [simpledcws.set-dict]: Failed to load the dict file in D:\website\ dict_utf8.xdb 及 rules.utf8.ini 是放在test.php 同一個資料夾下 另有我試過用 $scws->set_dict...