搜索

大约有 300 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.3857秒)

171.RE: 关于自建字典问题

发布时间:2013-09-02 04:09 t By gwgwgw

...了论坛的一些资料,重新进行配置如下$cws->set_dict(ini_get('scws.default.fpath') . '/a.txt' , SCWS_XDICT_TXT);(注:a.txt)为文本字典,运行无报错,但是无法正确匹配(如:我的a字典就2个词,好纠结啊,纠结死啦,但是当我输入时还是分词...

172.使用自定义词库的时候,部分词会丢失

更新时间:2014-04-18 17:04 t By tianly

使用的版本是SCWS-1.2.2 我用自己的词库替换了dict.utf8.xdb,然后尝试分词“朝鲜近日播放的一个纪录片中,发现”,发现“纪录片中”在分词结果中丢失了 Array ( [word] => 朝鲜 [off] => 0 [len] => 6 [idf] => 0 [attr] => @ ) Array ( [word] => 近...

173.关于 Xunsearch PHP-SDK

...而悠久的 [Xapian][1],分词采用 自主研发同样也是开源的 [SCWS分词][2],两者完美结合,理论上单个搜索库支持 40 亿条 记录。可编译运行于 Linux/FreeBSD 等各种 UNIX 类型的系统。 *Xunsearch PHP-SDK* 是该项目的 PHP 语言开发工具包,面...

174.RE: 搜索问题

更新时间:2012-10-25 13:10 t By hightman

...以考虑修改C代码的部分,修改 src/import.h #define DEFAULT_SCWS_MULTI 3 把 3 改为 15 然后重新编译并重建索引就可以了 3. 用自定义分词,自己按字划分

175.XSTokenizerScws

XSTokenizerScws All Packages | 方法(函数) 包 XS.tokenizer 继承关系 class XSTokenizerScws 实现接口 XSTokenizer 始于 1.3.1 版本 1.0.0 源代码 sdk/php/lib/XSTokenizer.class.php SCWS - 分词器(与搜索服务端通讯) Public ...

176.使用SCWS的libscws C源码,测试分词不成功

发布时间:2014-01-02 18:01 t By banderuilq

1,下载了SCWS的源码,使用其中的libscws2,并下载了 [简体中文(UTF-8) (3.9MB,28万词,2013/01/08更新)] scws-dict-chs-utf8.tar.bz2。 3,使用示例代码: #include #include #define SCWS_PREFIX "/usr/local/scws" main() { scws_t s; scws_res_t r...

177.安装的时候出现you should use --build, --host, --target这样的提示是什么原因?

更新时间:2014-05-19 12:05 t By 情雨轩

...时候出现了下面这样的问题 是什么原因?求指点 Checking scws ... setup.sh: line 158: test: cd: binary operator expected setup.sh: line 161: test: cd: binary operator expected no Installing scws (1.2.3-dev) ... Extracting scws package ... Configuring scws ... ----- configur...

178.xunsearch-1.0.0 正式版

更新时间:2011-09-30 14:09 t By hightman

...是采用 C/C++ 开发多线程服务端,索引设计基于 Xapian 和 scws 中文分词。单库最多支持 40 亿条数据,在 500 万网页大约 1.5TB 的数据中检索时间不超过 1 秒(非缓存)。 [b]简单易用:[/b]前端是使用脚本语言编写的开发工具 (SDK),目...

179.疑惑:分词数上限和标点符号控制

发布时间:2013-05-10 17:05 t By Brady.Li

...使用一切顺利不过关于两个函数比较疑惑。 使用的是php_scws.dll (1.2.1) ,php扩展 其一: strpos($w['word'],"5) 参数limit,设置分词数上限,可否不控制上限?参数是什么 其二: set_ignore(bool yes) 参数:true的话,表示忽略标点,但...

180.RE: 冒昧的问一下——怎么用tf和idf来计算权重?

发布时间:2012-02-22 18:02 t By vanni

...容如下: 1 相宜本草 2 雅漾 3 舒护 4 活泉水 # scws -A -d /hp/opt/scws/dict/default.utf8.xdb:/home/vanni/scws/mydict.txt -c utf8 "相宜本草洗面奶和雅漾舒护活泉水哪个好" 相宜/a 本草/nz 洗面奶/nz 和/c 雅漾/@ 舒护/@ 活泉水/@ 哪个/r 好/a ...

  • 时间不限
  • 按相关性排序