搜索

大约有 200 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.6837秒)

111.请教一个新手问题

发布时间:2014-02-19 00:02 t By limw

中国国民党荣誉主席连战及随访 结果分词就把“连战及”分到一起了。 请问有解决办法嘛? 似乎两个字的名字,容易和后面的字分到一起。 我在论坛中看到了“武松杀”的帖子,但是貌似没有解决办法? 谢谢。

112.关于 misc/ 目录下的文件

发布时间:2007-06-06 10:06 t By hightman

CWS_cli.php - 命令行分词, 读取标准输入 CWS_query.class.php - PHP 访问 cscwsd 的类库 CWS_file.php - 针对文件分词 CWS_test.web.php - 网页测试 [code] cscwsd-0.0.x (PHP版查询交互程序示例...

113.RE: xunsearch-1.4.5 (基于 xapian 和 scws开源中文搜索引擎,高扛压不死锁)

发布时间:2013-03-26 16:03 t By vus520

...当的说明,希望你有时间能帮我解答一下。 现在自定义分词,是不是只能在索引的时候进行,我的项目中需要对内容进行自动分词,用于生成文章的tag,我自己给定了一个用户自定义词库,在$tokenizer->getTops()时,不能找出...

114.SCWS是否可以提供Python扩展?

发布时间:2012-03-05 12:03 t By frostmourn716

HI 在一个项目中使用到了scws PHP的扩展,感觉scws在分词效率和准确率,以及在返回结果的可用性上,显著高于其它的扩展,想问一下,scws是否可以提供Python的扩展?

115.XSTokenizerScws::getTops

...getTops(string $text, string $limit=10, $xattr='') $text string 待分词的文本 $limit string 在返回结果的词性过滤, 多个词性之间用逗号分隔, 以~开头取反 如: 设为 n,v 表示只返回名词和动词; 设为 ~n,v 则表示返回名词和动词以外的其...

116.RE: 搜索建议提供的词相关性不强

发布时间:2013-05-13 15:05 t By hightman

默认是拿分词结果当初始值的。。。

117.scws加载词库和规则集失败,使用者为啥不知道呢?

更新时间:2010-12-09 22:12 t By lauxinz

...中不少都是词库没有加载上,却没有加以判断,结果发现分词结果不准确。 其实在scws文档中有这么一句话: [i][b]注:xdict_t 和 rule_t 分别是词典和规则集的指针,可判断其是否为 NULL 来判断加载的成功与失败。[/b][/i] 调...

118.1.1.2的 自定义字典无法使用

更新时间:2010-05-23 01:05 t By 逆雪寒

...->set_rule(ini_get('scws.default.fpath') . '/rules.utf8.ini'); 那么就分词正常. 这个是第一个问题. 第二个问题就是,定义自定义的词典. 看到说1.1.2 支持自定义的 txt 字典.于是我就这样写了 $so->add_dict(ini_get("scws.default.fpath") . '/dict.utf8....

119.按字段值分面搜索

...件做筛选搜索, 支持分面的字段需要进行索引,而它的分词方式最好必须是 `full` 即整值索引。 用法详细示范 ----------- 以论坛文章搜索为例,每篇文章均属于不同版块(字段为 fid)、不同的发表年份 (字段为 year),我们需...

120.RE: scws 1.1.2 php extension安装的问题

发布时间:2010-06-20 23:06 t By sambohuang

我也是楼主这个情形,分词结果一样。 最后发现下载的词库权限是600 chmod +r后就正常了

  • 时间不限
  • 按相关性排序