搜索

大约有 196 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0045秒)

81.RE:1265

发布时间:2008-03-05 17:03 t By hightman

打包的时候少了rules_cht.utf8.ini 的原因呵,问题不大,自己touch一个或从rules.ini转换一个 现下载包已经更新并包含了该文件

82.RE: scws下载不了啊

发布时间:2010-03-22 15:03 t By pardis_xiong

ok,搞定了,这个php_scws.dll貌似不区分gbk还是utf8,而词库和另外一个rules则要区分。

83.RE: 分词不对

发布时间:2010-04-26 16:04 t By hightman

一个快速解决办法在 rules.ini 及 rules.utf8.ini 的 v + v = 10 之后添加以下一行 q + vn = 10 即可

84.RE: 词典格式疑问?

发布时间:2012-02-22 19:02 t By vanni

为什么不能定义超过3个中文的词呀。(自定义词典使用的是UTF8格式) 比如我定义 “相宜本草” ,但是没有用!

85.RE: 如何去除无用的词?

发布时间:2013-05-02 12:05 t By darena

我用UTF8, 也是"我是中国人", 出来的正好只有"中国人"一个词

86.RE: 遇到一个分词错误的问题

发布时间:2014-02-10 10:02 t By hightman

rule.utf8.ini里那些调节是通过常用词性组合来改变权重,这要求 词典的词性必须十分准确才行

87.XSDatabaseDataSource::getCharset

... public mixed getCharset() {return} mixed 如果数据库不支持 UTF-8 转换则返回 false 源码: sdk/php/util/XSDataSource.class.php#L138 (显示) public function getCharset(){ if ($this->db->setUtf8()) { return 'UTF-8'; } return parent::getCharset();} 返回...

88.二元分词问题

发布时间:2011-11-14 17:11 t By icebolt

project.name = demo2 project.default_charset = utf8 server.index = 8383 server.search = 8384 [pid] type = id [subject] index = both tokenizer =xlen(2) 二元分词只能对英文生效,对中文不生效 同时急于需要一元分词,主要是做黑词筛选用,因为有...

89.RE: [BUG]安装scws运行后竟然乱码

发布时间:2011-08-18 10:08 t By ixqbar

难道就不支持UTF-8?

90.RE: 布尔搜索问题

发布时间:2012-01-12 14:01 t By a114708367

[quote='hightman' pid='425' dateline='1326348954'] 限制是按字节来的,不是按字符数量啊。 /** * max length of query string for CMD_QUERY_ */ #define MAX_QUERY_LENGTH 80 [/quote] - -!我知道啊 我的是utf8算完后共占77字节。

  • 时间不限
  • 按相关性排序