... 传入 NULL 表示统计全部词性。 返回值:如果有返回 1 没有则返回 0 错误:无 ·scws_top_t scws_get_words(scws_t s, char *xattr); 描述:返回指定词性的关键词表,系统会根据词语出现的先后插入列表。参数 xattr 用来描述要排除 ...
...可能必须适当修改才能运行在 Windows 平台中。这套 scws 库没有外部扩展依赖,代码力争简洁高效,针对分词词典组织上做了一些优化。 除分词外,由于分词词库采用的是自行设计的xdb 和 xtree 结构,故本库函数也可以用以 XDB 和 ...
...这个值均不返回结果? 我测试搜索了很多词语,但是没有返回任何结果,总是array()
看了论坛很多帖子,其中不少都是词库没有加载上,却没有加以判断,结果发现分词结果不准确。 其实在scws文档中有这么一句话: [i][b]注:xdict_t 和 rule_t 分别是词典和规则集的指针,可判断其是否为 NULL 来判断加载的成...
...到这个值均不返回结果? 我测试搜索了很多词语,但是没有返回任何结果,总是array() [/quote] 参见:[url]http://www.xunsearch.com/doc/php/guide/search.overview#ch4[/url] 搜索之后必须调用 setQuery 然后调用不带参数的 search() 才能进行搜索日...
... 不是线程安全的? 看代码xdict_query()是线程安全的,并没有使用全局变量和静态数据,只是返回值可能是指向一块动态内存,需要用户来释放。多个线程同时调用该函数并没有需要互斥的地方。
...方便使用,当 send_text 方法或 scws_send_text 函数被调用前,没有加载词典和规则集时,系统会自动在scws.default.fpath(ini配置)中查找相应的字符集词典。词典和规则文件的命名方式为 dict[.字符集].xdb 和 rules[.字符集].ini ,当字符集是 ...
...么用不上啊。还有 gbk 词库 和 utf8 的容量区别也很大。有没有跟gbk 编码的一样 utf8词库呢?
...么用不上啊。还有 gbk 词库 和 utf8 的容量区别也很大。有没有跟gbk 编码的一样 utf8词库呢? [/quote] 基于SCWS自动分类演示:http://www.ftphp.com/scws/demo/a.php 请问一下这个分类是根据什么原理来的呢?怎么分类这么离谱呢?