...望能够整词匹配。 我看了 前面的一个帖子,说要修改源代码,请大侠指导一下,怎么修改? 那个文件以及大概的行数, 非常感谢!!!!
...class XSDebugFilter 实现接口 XSDataFilter 版本 1.0.0 源代码 sdk/php/util/XSDataSource.class.php 内置调试过滤器, 直接打印数据内容 Public 方法 隐去继承来的方法 名称描述定义于 process() XSDebugFilter process...
... hightman 独立完成,本人保留一切相关权利。 本软件开放源代码提供下载,旨在促进交流和提高。分词是一个长期的难题,希望这次的发布起到一个抛砖引玉的作用。 本软件未经同意严禁修改移植代码进行分支发布或商业用途...
...XSTokenizerSplit, XSTokenizerXlen, XSTokenizerXstep 版本 1.0.0 源代码 sdk/php/lib/XSTokenizer.class.php 自定义字段词法分析器接口 系统将按照 getTokens 返回的词汇列表对相应的字段建立索引 Public 方法 隐去继承来的方法 ...
...复看过开发文档,还是不知道什么原因... 【测试页面源代码:】 【错误日志:】 [29-Sep-2012 12:02:48] 致命的运行时错误(E_ERROR) Uncaught [XSException] ../../xunsearch/sdk/php/lib/XS.php(2204): Permission denied(C#13) thrown /var/www/xunsearch/sdk/php/...
...valgrind程序运行了一下,显示存在内存泄露,查看了一下源代码,的确有一个地方没有free。在 scws.c/scws_has_word()函数中: __PARSE_XATTR__; // 这个宏里有一个内存申请:at = (word_attr *) malloc(cnt); 申请的内存没有释放。应该在scws_has_wo...
...都是按官方的说明来做的,然后下载官方我的演示程序(源代码另存为)。 UTF-8版本的一直不成功,分词结果就如我最开始的截图; GBK版本的在保存文件的时候选择文件编码为ANSI,就一切正常了。如果编码选择GB2312,就会出现...
...ass XSTokenizerSplit 实现接口 XSTokenizer 版本 1.0.0 源代码 sdk/php/lib/XSTokenizer.class.php 内置的分割分词器 Public 方法 隐去继承来的方法 名称描述定义于 __construct() XSTokenizerSplit getTokens() XSTokeni...
...lass XSTokenizerXlen 实现接口 XSTokenizer 版本 1.0.0 源代码 sdk/php/lib/XSTokenizer.class.php 内置的定长分词器 Public 方法 隐去继承来的方法 名称描述定义于 __construct() XSTokenizerXlen getTokens() XSTokeniz...
... class XSErrorException » XSException » Exception 版本 1.0.0 源代码 sdk/php/lib/XS.class.php XS 错误异常类定义, XS 所有操作过程发生错误均抛出该实例 Protected 属性 隐去继承来的属性 名称类型描述定义于 code ...