目前不行。只能自己生成 scws 的词典并放进 $prefix/etc/dict.utf8.xdb 覆盖 词典可以自己先制作TXT格式在利用SCWs提供的工具转换成XDB格式 [url]http://www.hightman.cn/bbs/showthread.php?tid=712[/url] 这个贴子后面有讲到
...hightman' pid='3485' dateline='1270715102'] 自定义可以的,但要用工具 转成XDB的话必须四个字段都齐全。 [/quote] 谢谢老大回答,再问一下,那我其它的属性如何才能得到,比如我的word很多,我能都设置一样的属性吗,这样有什么影...
...(非缓存)。 简单易用:前端是使用脚本语言编写的开发工具 (SDK),目前仅支持 PHP 语言。API 简单清晰,开发难度极低,提供全中文的示例代码、文档、辅助脚本工具等。 全功能:除支持基础的自定义分词、字段检索、布尔...
我用您发布的工具,把字典解压。得出了关于的词的字段 WORD TF IDF ATTR 当机立断 14.01 8.10 i WORD ATTR我都能理解。 上贴说的逐字分词后 计算权重的时候使用IDF,貌似就是类似基于字典的最大概率方式来定义权重...
从即日起,scws 主页新地址为: [url]http://www.xunsearch.com/scws/[/url] scws 全部源码及工具代码托管到 github(内含相关的文档及说明),如下地址: [url]https://github.com/hightman/scws[/url]
...段。我们以后将着力先进行稳定性的跟进,完善周边配套工具和应用产品。 [b]主要更新如下:[/b] 1. 内部优化中文复合词的查询分析器,升级整合最新的 xapian-1.2.8、scws-1.1.9 2. 新增自动同义词搜索功能,详见同义词专题文...
先谢谢highman提供了这么方便的分词工具! 使用中发现,在字典的建立过程中,及php make_xdb_file.php 报了一大堆警告: Notice: Undefined index: tf in C:\xampp\php\xdb\make_xdb_file.php on line 93 Notice: Undefined index: idf in C:\xampp\php\xdb\make_xdb_file.p...
[quote='hightman' pid='3616' dateline='1363966246'] 你缺少基本的编译工具,先装好 g++,gcc,make这些 [/quote] 但是我已经yum install gcc 和 yum install gcc-c++过了,yum不是安装好了吗