...搜索页面还在测试中,未上线。 另外将来是否会提供C接口呢?一方面我们的BBS提供telnet访问,以后会需要在telnet界面提供搜索,另一方面可能会在其它语言下使用你们的搜索引擎。
... 我想问的是 既然是 集成scws 那么 1.有没有提供scws的api接口,实现短语分词功能 2.是否可以对scws自定义中文词典,方便扩展
... 包 XS.util 继承关系 class XSDebugFilter 实现接口 XSDataFilter 版本 1.0.0 源代码 sdk/php/util/XSDataSource.class.php 内置调试过滤器, 直接打印数据内容 Public 方法 隐去继承来的方法 名称描述定义于...
...搜索对中文支持太弱,xunsearch又提供了非常方便、简洁的接口,目前测试结果比较理想。 补充:当前总数据量15万条,数据库不到300M,每天增长中。
...码 sdk/php/lib/XSTokenizer.class.php 自定义字段词法分析器接口 系统将按照 getTokens 返回的词汇列表对相应的字段建立索引 Public 方法 隐去继承来的方法 名称描述定义于 getTokens() 执行分词并返回词列表 XSTokeniz...
...宵做了一个晚上,终于搞定了。 帝国CMS7.0,迅搜,微信接口 只要在微信上发布关键词,比如阿迪达斯,就有相关阿迪达斯的数据出来。 大家可以交流。 上传以下图片: [img]http://bbs.phome.net/ebb_data/tran/2014-07/1406263350.jpg[/img...
我使用scws的C版本提供的接口对省份、地市信息进行分词,发现分词的结果有时不是希望达到的结果。例如: 1 洛阳市廛河华林水席村 希望的结果为:洛阳市 廛 河 华林 水 席 村(词典中有洛阳市,市廛,河华,华林) 实...
... 包 XS.tokenizer 继承关系 class XSTokenizerSplit 实现接口 XSTokenizer 版本 1.0.0 源代码 sdk/php/lib/XSTokenizer.class.php 内置的分割分词器 Public 方法 隐去继承来的方法 名称描述定义于 __construct() XS...
... 我想问的是 既然是 集成scws 那么 1.有没有提供scws的api接口,实现短语分词功能 2.是否可以对scws自定义中文词典,方便扩展 [/quote] 目前没有直接支持自定义词典,而是直接读取 dict.utf8.xdb 你自己改词也必须转换成这个词典文...