想做自定义词库的功能。 哪位大侠,是否可以告知, http://www.xunsearch.com/scws/demo/get_tfidf.php 的算法。 谢谢
这个xunsearch暂时还没有提供这项功能,但可以先变通的如下方式处理: 在提取API后面自己再简单加个判断?现在新版 1.3.1 提供了 scws 接口,只要把这些黑词加到自定义词典,并取一个独特的词性,那么就可以用 XSTokenizerScws::has...
...以PHP扩展语言为例)。 最新版下载地址:[url]http://www.xunsearch.com/scws/download.php[/url] -- [b]scws-1.2.2 发布于 2013-7-11[/b] 1) 改进中英夹杂的长词复合分法,比如 "奥迪A6/奥迪/A6" 2) 修正 pscws23 演示文件的一些写法与新版 PHP 不兼容 ...
自定义分词器 `Xunsearch` 默认内置了功能强大的 [SCWS][1] 分词系统,也附加提供了一些简单常见的分词规则, 但考虑到用户的个性需求,特意提供了自定义分词器的功能。 > note: 自定义分词器存在一个缺陷,它不支持存...
...:error: scws_new() NOT found in libscws, please check it first http://bbs.xunsearch.com/showthread.php?tid=7 按照这个贴子处理,还是不行。 没有 ln -s libuuid.so.1.0 libuuid.so; 这个文件。[hr] 除了把系统重装,并且装成32位之外,还有什么好方法吗?
全部是英文单词 数据来源: twitter tumblr amazon alibaba flickr 等的标签 原来多是词组形式 改成了scws的单字形式 没有附加任何属性 也就是说全部使用默认属性 参考 http://www.xunsearch.com/doc/php/guide/index.dict
[quote='hpxl' pid='7811' dateline='1400033006'] sdk/php/app/demo.ini配置 [id] type = id [/quote] 是scws-1.2.2 的如何让它支持自已定义的英文词库? 像http://bbs.xunsearch.com/showthread.php?tid=3088 这样修改代码吗?
...件详解 基础说明 ------- - 项目配置是一个 `Xunsearch` 项目的核心灵魂,非常重要,通常保存为 .ini 文件 - 以分号开头的行表示注释,空行直接被忽略不起任何作用 - 中括号包围的每个分区均为字段配置,字段个数根据...
...定义分词器来补充。。。 将你的词复制到 [url]http://www.xunsearch.com/scws/demo/v4.php[/url] 进行实测,分割结果为: E14188m E14188 14188 14188m 那么搜索以上4个词都是可以搜索到的,至于你从中提取 e1418 来检索,那是很难有合适的策略去...