...供调用。 [/quote] 感谢管理员回复. 其实我的意思大概可以简化为: 最长分词模式. 分出来的词要达到符合语法的最长.这个难度估计不小,呵呵,也可能是比较不现实的需求. 自己架设scws分词库程序当然可以导入自己的词库,但是...
由于词库太大干扰所致,建议可以附加一个小词典(目的是删除这些无用词汇,以下我写出来作参考,把下面的文字存成dict.txt,然后在原有的set_dict之后加上 scws_add_dict(s, 'path/to/this_ad_dict.txt', SCWS_XDICT_TXT); 这样使文本词典生效. ...
...怎么样 命令都无法结束进程! 我强制 kill 8781 8783 就可以把服务进程关闭了 然后我启动xs 接着我再使用 命令关闭 又可以了 我这个是出于什么问题 会有这样的情况 请问应该怎么结束进程
...会有问题吗?如果你这段字是用空格或逗号分隔,那么你可以用 split 这个分词器啊。 搜索的时候搜索任何一个分割后的TAG都可以搜索到。 [/quote] 呵呵,管理员没听明白楼主的意思,他希望xunsearch能提供分词接口,给其他...
服务端暂时不支持在WIN平台运行,但SDK可以在WIN下,至于MYSQL数据导入XUNSEARCH文档都比较 清楚了。 假如您在LINUX、UNIX服务器装好了XUNSEARCH,首先看一下工作流程,创建项目后用工具 可以导入索引。 1.工作流程 [url]http://www.x...
...過 1gb 我有看到 gen_dict.c 但是是有有繁體utf8的 dict.txt 可以讓我自行編輯 麻煩 hightman 大大 [/quote] 这样的错误可能是运行的平台的字节序不一样或者.xdb文件已损坏所导致的. 我发一份我这边正确导出的词库吧.(你可以从附...
这个不能随便改,但可以通过调整源码的编译参数来改。通常不需要这么做啊,实在有必要时你们可以考虑继承XSTokenizerScws 来自己修改它。
非常不错。我把此贴转到案例版面吧。 搜索结果界面还可以让专业美工再美化一下^-^ 我自己在大学时很多时间也泡在 telnet bbs上呢,对这类BBS的感情很特殊,很多电脑技术也是在此基础上学习起来的。 我的论坛也开着,是 Mapl...
...12245'] 没有内置工具,你想办法读出数据再调用API装入就可以了 [/quote] 嗯,是的。我应该可以通过扩展原有的XSDatebase.class.php来增加链接sql serve来链接数据库,并执行查询, 然后通过XSDocument的扩展来实现索引的添加!
xunsearch 搭配工作的不是标准的 xapian-core,而是打过 scws 补丁的 xapian-core-scws。压缩包可以从发布的 xunsearch-full 中获得。 你也可以下载标准的 xapian-core 包,然后将源码里的 xapian-scws/path.xapian-core-scws 补丁打进去