是你的.txt文件不规范吗,为什么会报不存在['tf'] & ['idf'] 啊 phptool for xdb 有最新版啊,建议下载最新的:http://www.ftphp.com/scws/download.php#xtools
...oot@estar scws-1.1.5]# /usr/local/bin/scws -A -d "/usr/local/scws/etc/dict.xdb" "LG集团5.3%" LG/en 集团/n 5.3/en %/un +--[scws(scws-cli/1.1.5)]----------+ | TextLen: 10 | | Prepare: 0.0002 (sec) | | Segment: 0.0002 (sec) | +--------------------------------+ ...
...规则文件 $so->add_dict(ini_get("scws.default.fpath") . '/dict.utf8.xdb'); $so->add_dict("/usr/myapp/dict_extra.txt",SCWS_XDICT_TXT); $so->set_rule(ini_get('scws.default.fpath') . '/rules.utf8.ini'); // $so->set_duality(0); $so->set_ignore(0); $so->set_multi(0); 就是不行. 我...
...8的,而你调用了gbk的词典,把你的词典语句改为 dict.utf8.xdb 即可 3. dict_extra.txt 也必须是UTF-8编码 4. 删除词条,因为陈凯歌其实可能是因为人名关系导致切成词,可能会不受词典影响 5. 如果你非要用gbk 源码中 set_charset() 的参...
...立使用的 .h 文件添加 C++ 的 extern "C" 标记以便直接使用:xdb.h,xdict.h,xtree.h,pool.h,darray.h 最新下载地址:[url]http://www.ftphp.com/scws/download.php[/url] 演示地址:[url]http://www.ftphp.com/scws/demo.php[/url]
...8的,而你调用了gbk的词典,把你的词典语句改为 dict.utf8.xdb 即可 3. dict_extra.txt 也必须是UTF-8编码 4. 删除词条,因为陈凯歌其实可能是因为人名关系导致切成词,可能会不受词典影响 5. 如果你非要用gbk 源码中 set_charset() 的参...
...些优化。 除分词外,由于分词词库采用的是自行设计的xdb 和 xtree 结构,故本库函数也可以用以 XDB 和 XTree 数据存取(另行介绍)。 [size=3][color=blue][b]1. 数据类型[/b][/color][/size] (仅列出API中需要关注的部分) ·[b]scws 操作句柄...
... scws_t __declspec(dllexport)scws_fork(scws_t s); /* mode = SCWS_XDICT_XDB | SCWS_XDICT_MEM | SCWS_XDICT_TXT */ int __declspec(dllexport) scws_add_dict(scws_t s, const char *fpath, int mode); int __declspec(dllexport) scws_set_dict(scws_t s, const char *fpath, int mode); void __declspec(dllex...
...usr/local/xunsearch/etc/stopwords.txt' /usr/bin/install -c -m 644 'etc/py.xdb' '/usr/local/xunsearch/etc/py.xdb' make[2]: Nothing to be done for `install-data-am'. make[2]: Leaving directory `/usr/local/xunsearch-full-1.0.1/xunsearch-1.0.1' make[1]: Leaving directory `/usr/local/xunsearch-full-1.0....
...x02 // shuying.lee adds it //#define SCWS_SEG_MULTI 0x02 //#define SCWS_XDB_USAGE 0x04 #define SCWS_DEBUG 0x08 @@ -97,6 +98,7 @@ /* set ignore symbol or multi segments */ void scws_set_ignore(scws_t s, int yes); +void scws_use_rule(scws_t s, int yes); void scws_set_multi(scws_t s, int mo...