addIndex() 方法 public void addIndex(string $field, string $text) $field string 文本所属的字段名称 $text string 文本内容 源码: sdk/php/lib/XSDocument.class.php#L256 (显示) public function addIndex($field, $text){ $field = strval($field); if (!is_a...
hasWord() 方法 public bool hasWord(string $text, string $xattr) $text string 要判断的文本 $xattr string 要判断的词性, 参见 getTops 的说明 {return} bool 文本中是否包含指定词性的词汇 源码: sdk/php/lib/XSTokenizer.class.php#L382 (显...
fixWidth() 方法 public static string fixWidth(string $text, int $size, string $pad=' ') $text string 要修正的字符串 $size int 修正的目标宽度 $pad string 用于填充补足的字符 {return} string 源码: sdk/php/util/XSUtil.class.php#L50 (...
getResult() 方法 public array getResult(string $text) $text string 待分词的文本 {return} array 返回词汇数组, 每个词汇是包含 [off:词在文本中的位置,attr:词性,word:词] 源码: sdk/php/lib/XSTokenizer.class.php#L339 (显示) public function get...
getTops() 方法 public array getTops(string $text, string $limit=10, $xattr='') $text string 待分词的文本 $limit string 在返回结果的词性过滤, 多个词性之间用逗号分隔, 以~开头取反 如: 设为 n,v 表示只返回名词和动词; 设为 ~n,v 则...
.../ 加入头文件 require 'pscws/pscws4.class.php'; header("Content-Type:text/html;charset=utf-8"); // 建立分词类对像, 参数为字符集, 默认为 gbk, 可在后面调用 set_charset 改变 $pscws = new PSCWS4('utf-8'); $pscws->set_ignore('yes'); $pscws->set_dict('E:/scws/etc/dict....
..._string const&, bool, int, bool)' ./.libs/libchertcheck.a(chert_check.o)(.text+0x1036): In function `ChertTableCheck::check(char const*, std::basic_stri ng const&, int, std::basic_ostream &)': : undefined reference to `ChertTable::open()' ./.libs/libchertcheck.a(chert_check.o)(.text+0x1088): In...
... 3 个元素,其中: - *off* 表示这个词汇在源参数文本 _$text_ 中的起始偏移位置 - *attr* 这个词汇的词性,使用北大标注 - *word* 分好的词条 ~~~ [php] $text = '迅搜(xunsearch)是优秀的开源全文检索解决方案'; $words = $tokenizer->getResult(...
...argv[]) { scws_t s; scws_res_t res, cur; char *text;// = "Hello, 我名字叫李那曲是一个中国人, 我有时买Q币来玩, 我还听说过C#语言"; text = "我是一名中国的程序员"; if(argc == 2) text = argv[1]; ...
$text = "a vnii a"; function get_tags_arr($title){ require 'pscws4/pscws4.class.php'; $cws = new PSCWS4('utf8'); $cws -> set_charset('utf-8'); $cws->set_dict('dict.utf8.xdb'); $cws->set_rule('pscws4/etc/rules.utf8.ini'); $cws->send_text($title); $words = $cws->get_tops(10); $cws->c...