...任何编辑器修改 - 每行一条记录表示一个词,每行包含 1~4 个字段,字段之间用空格或制表符(\t)分隔 - 字段含义依次表示 “词语”,“词频(TF)”,“逆词频率(IDF)”,“词性(ATTR)” - 后面三个字段如果省略依次使用 scws 的...
...of the project(S#508) #0 lib/XS.php(2067): XSServer->execCommand(Array, 201) #1 lib/XS.php(2028): XSServer->setProject('demo') #2 lib/XS.php(2011): XSServer->open('8383') #3 lib/XS.php(342): XSServer->__construct('8383', Object(XS)) #4 lib/XS.php(249): XS->getIndex() #5 Indexer.php(155): XSCom...
我安装的MySQL 5.1.30是大概在2月份使用源码编译安装的,有应用在上面跑,因为我看到文档里说“6. 打完补丁后需要重新编译并安装一下 mysql,这不需要重新 configure ,只需在该目录执行 make ; make install 即可” 所以我就把scws 插...
...ce.class.php(49): Undefined data source type: `test.csv' #0 Indexer.php(241): XSDataSource::instance('test.csv', NULL) #1 {main}[hr] 我在util下面增加了一个test.csv下如了下面这些数据 1,关于 xunsearch 的 DEMO 项目测试,项目测试是一个很有意思的行为!,1314336158 ...
hi, i got a big problem, my env is php5.3.3/apache/2.2.17 all x64bit, now, all my service is ok but the php_scws.dll, run php got error: ------------------------------------------ PHP Warning: PHP Startup: Unable to load dynamic library 'D:\home\php\ext\php_s cws.dll' - %1 is not a valid Win32 ...
function get_tfidf($word, $count) { if ($count < 1000) $count = 21000 - $count * 18; $tf = log($count); $tf = pow($tf, 5) * log(strlen($word)); $tf = log($tf); $idf = log(5000000000/$count); //if ($tf > 13) $idf *= 1.4; return array($...
function get_tfidf($word, $count) { if ($count < 1000) $count = 21000 - $count * 18; $tf = log($count); $tf = pow($tf, 5) * log(strlen($word)); $tf = log($tf); $idf = log(5000000000/$count); //if ($tf > 13) $idf *= 1.4; return array($...
...引数据入库时根据时间判断该对应哪个库名,比如用 db_1, db_2, ... 来区分 而在搜索的时候统一用 addDb 把所有的 db 都添加进支就可以了。 分后库对于旧库还可以调用 bin/xapian-compact 进行压缩、优化提升效率。
...类 XSCsvDataSource, XSDatabaseDataSource, XSJsonDataSource 版本 1.0.0 源代码 sdk/php/util/XSDataSource.class.php 索引数据源抽象基类 此部分代码仅用于 indexer 工具程序 Protected 属性 隐去继承来的属性 名称类型描述定义于...
...词** 是全文检索中非常重要和必要的一项基础功能。从 `1.3.0` 版本起,`Xunsearch` 开始提供同义搜索搜索功能。 什么是同义词搜索 --------------- 为了更好的提升用户搜索体验,我们希望用户在搜索“浙江大学”的时候也同时匹配...