... ~~~ 3. ### 服务器连接参数 服务端连接参数的格式包含 3 种格式: 1. *端口号(数字)*,连接 `localhost` 的该端口号 (例:`8383`) 2. *地址:端口号*,冒号连接地址(域名、IP地址)和端口 (例:`127.0.0.1:8383`) 3. *文件路径...
...可用任何编辑器修改 - 每行一条记录表示一个词,每行包含 1~4 个字段,字段之间用空格或制表符(\t)分隔 - 字段含义依次表示 “词语”,“词频(TF)”,“逆词频率(IDF)”,“词性(ATTR)” - 后面三个字段如果省略依次使用 scws...
...,它默认连接本地的 `8383、8384` 端口并使用 UTF-8 编码,包含四个字段:pid,subject,message,chrono 。 填充索引数据 ----------- 出于测试方便,我们采用 `csv` 格式来写入索引数据,请先按以下方式操: ~~~ cd $prefix/sdk/php util/Indexer...
...集。 * _-q|--query _ 指定要搜索的查询语句,如果语句中包含空格请用使用双引号包围起来。 * _--hot[=total|last|cur]_ 用于显示指定项目的热门搜索词,此时 _query_ 参数无意义。 选项值含义分别表示总搜索量、上周搜索量、本...
...ce _ 用于指定数据源,数据源有以下 2 种情况。 凡是包含冒号的数据源均视为 SQL 数据源,自动将 _--sql_ 选项的值作为参数传递给数据源; 其它情况则为文件数据源,自动将 _--file_ 选项的值作为参数传递给数据源对象...
...在 scws_send_text 之后调用,scws_has_word 用于判断文本中是否包含 xattr 词性的词汇,常用于脏词判断,将脏词统一设为一个词性。 3. scws_get_words 返回词性属于 xattr 的词汇列表,返回顺序为词出现的先后顺序,词的结构和 get_tops ...
...在 scws_send_text 之后调用,scws_has_word 用于判断文本中是否包含 xattr 词性的词汇,常用于脏词判断,将脏词统一设为一个词性。 3. scws_get_words 返回词性属于 xattr 的词汇列表,返回顺序为词出现的先后顺序,词的结构和 get_tops ...
...正常的问题 5) 移除 scws.c 中关于 jabberd2s10 的注释,已不包含它的代码 6) 为独立使用的 .h 文件添加 C++ 的 extern "C" 标记以便直接使用:xdb.h,xdict.h,xtree.h,pool.h,darray.h [b]scws-1.1.8 发布于 2011-07-30[/b] 1) win32/目录新增 vc9 工程...
...个词性之间用逗号隔开。当以~开头时表示统计结果中不包含这些词性,否则表示必须包含,传入 NULL 表示统计全部词性。 [b]返回值:[/b]返回词表集链表的头指针,该词表集必须调用 scws_free_tops 释放 [b]错误:[/b]无 [b][color=#ff660...
...: - lib/XS.php 入口文件,所有搜索功能必须包含此文件 - lib/XS.class.php 未合并带注释的入口文件,会自动加载其它 .class.php 文件 - util/RequireCheck.php 命令行运行,用于检测您的 PHP 环境是否符合运行条件 -...