1,下载了SCWS的源码,使用其中的libscws; 2,并下载了 [简体中文(UTF-8) (3.9MB,28万词,2013/01/08更新)] scws-dict-chs-utf8.tar.bz2。 3,使用示例代码: #include #include #define SCWS_PREFIX "/usr/local/scws" main() { scws_t s; scws_res_t r...
...os 1. 检查 tmp/indexd.log日志里面说端口号已经被占用了; 2. 进一步检查发现是 xs-indexd 进程死掉了,用 xs-ctl.sh restart 也无法重启; 3. 只能用 kill -9 结束后,再重启,之后问题解决; 之前都是检索进程出问题,所以知道是 xs-sear...
...感谢了。 tags提取页面 [url]http://www.adminlink.net.cn/detail_187327.html[/url] 搜索tags就看到了。 有很多这样的详情页都用到了scws来提取tags. 提取到了tags,然后链接到搜索页比如服饰关键词链接到了 [url]http://www.adminlink.net.cn/websearch/search....
...典加载和使用,以 # 开头的行为注释 > note: 该功能自 `1.2.0` 版本起方可使用,源自网友建议。 项目自定义词库 ------------- 某些情况下,不同的项目需要不同的特殊词库。每个搜索项目的自定义词库文件如下: ~~~ $prefix/data/项...
...测试 # 搜索 demo 中包含 "测试" 的数据,并限制最多返回 2 条结果 util/Quest.php -p demo -q 测试 --limit=2 # 列出 demo 项目中以 "x" 开头的搜索建议 util/Quest.php --suggest demo x # 在 demo 项目中修正搜索词 "xm" util/Quest.php --correct demo xm # 在 de...
...或检索。 添加、修改索引数据,使用方法参照 [XSIndex][2]。 对于 ActiveRecord 对象来讲,建议在相关的 `afterSave` 和 `afterDelete` 中进行索引同步。 ```php $data = array('pid' => 1234, 'subject' => '标题', 'message' => '内容'); Yii::app()->search->add($dat...
...rch->getAllSynonyms(10, 5); // 查看包含隐藏同义词根在内的前 20 条记录 $synonyms = $search->getAllSynonyms(20, 0, true); ~~~ 除了调用 `API` 外,您还可以使用 [Quest 搜索工具](util.quest#ch2) 进行同义词管理。 使用同义词搜索功能 ----------------- ...
由于词典条目多达26万条之巨,在整理的时候已经把很多明显不对的标注或词条清理了,但仍然肯定有很多错误的条目。 主要表现在不是词的列在词里,还有词性标注错误的。本词典中的标注使用的是北大版本的标注集(见附...
... function get_tfidf($word, $count) { if ($count < 1000) $count = 21000 - $count * 18; $tf = log($count); $tf = pow($tf, 5) * log(strlen($word)); $tf = log($tf); $idf = log(5000000000/$count); //if ($tf > 13) $idf *= 1.4; return array($t...
... function get_tfidf($word, $count) { if ($count < 1000) $count = 21000 - $count * 18; $tf = log($count); $tf = pow($tf, 5) * log(strlen($word)); $tf = log($tf); $idf = log(5000000000/$count); //if ($tf > 13) $idf *= 1.4; return array($t...