请问是否可以在 win 环境下运行? 请 务必写一个 针对各环境下安装与设置的程序就好了 我愿意付些费用
[quote='hightman' pid='4506' dateline='1303195392'] 新版会开发一个API直接在函数里生成临时词库供调用。 [/quote] 感谢管理员回复. 其实我的意思大概可以简化为: 最长分词模式. 分出来的词要达到符合语法的最长.这个难度估计不小,呵呵...
...hightman' pid='30' dateline='1316510603'] 参见代码如下,说明是$prefix/tmp 目录无法写入文件,检查一下目录是否存在,以及检查 indexd.log 看看里面的错误信息是什么。 752 sprintf(rcvfile, DEFAULT_TEMP_DIR "%s_%s.rcv", conn->user->name, db->name);...
[quote='powerkylin' pid='4074' dateline='1298522611'] "undefined reference to `_WinMain@16'" [/quote] 我也遇到这个问题,求助Hightman。 在cgywin的官网上找了相关资料,据说是cgywin在没有定义main时,会报次错误[hr] 终于找到解决方案了,根据cgywin...
由于词库太大干扰所致,建议可以附加一个小词典(目的是删除这些无用词汇,以下我写出来作参考,把下面的文字存成dict.txt,然后在原有的set_dict之后加上 scws_add_dict(s, 'path/to/this_ad_dict.txt', SCWS_XDICT_TXT); 这样使文本词典生效. ...
有个问题,在演示地址中,统计词性: 需要屏蔽 ~vn,~nr时, 仅第一个有效,不能设置多个
[quote='hightman' pid='3685' dateline='1282406611'] 返回的时候根据长度排除啊,GBK的话单字就是2字节,很好判断啊,UTF-8三字节,但也能判断出是不是一个单个的汉字 [/quote] 原来如此。明白了。非常感谢!
明白你的意思。总之,mem方式比xdb性能要高些,只是会占用比较多的内存资源,如果需要经常频繁的进行分词操作就应该采用mem方式,比如搜索引擎的建索引时主要耗费的时间都花费在分词上,反正现在内存也便宜,而且词典不...
[quote='hightman' pid='184' dateline='1320990561'] 重启一下服务 端吧,应该是直接 rebuild 没有完成。 bin/xs-ctl.sh restart [/quote] 重新启动服务试过,后来服务器也重启过了。但一直是这个错误,估计是和我删除了部分临时文件有关系?
...,请教一个问题 我在php中如何引用XS.php这个文件呢? require的话会提示报错 我是安装在默认目录 /usr/local/xunsearch的 但是我使用 require '/usr/local/sdk/php/lib/XS.php'; 会提示require() [function.require]: Failed opening required '/usr/local/sdk/php/l...