搜索

大约有 200 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0055秒)

41.RE: SCWS不支持英文和中英文混合分词吗?

发布时间:2010-08-27 10:08 t By hightman

除中文外其余的只按标点符号或空格切分,无缝连在一起的单词字母是不支持的。

42.RE: Hightman您好,我的分词怎么不对啊

更新时间:2010-08-19 14:08 t By hightman

改成这样,scws_open 本身是没有函数的,文档是正确的,但附带提供的 scws.php 写错了,所以如果 ini_get('scws.default.charset')是utf-8那么就会按utf-8来, 所以应该 显式的调用 scws_set_charset() $cws = scws_open(); scws_set_charset($cws, "gbk"); scws_set...

43.RE: Hightman您好,我的分词怎么不对啊

发布时间:2010-08-19 09:08 t By assad

$cws = scws_open("gbk"); scws_set_dict($cws, "./etc/dict.xdb"); scws_add_dict($cws, "./etc/s.txt",SCWS_XDICT_TXT); scws_set_rule($cws, "./etc/rules.ini");

44.RE: 使用SCWS的libscws C源码,测试分词不成功

发布时间:2014-01-03 10:01 t By banderuilq

我知道我的问题出在哪了,我把这个文件存储为UTF8格式的文件就好了,输出结果就正常了。

45.2007简易分词第4版(scws-0.1.x)体验

发布时间:2007-06-06 11:06 t By hightman

...专名自动识别,也支持UTF-8/GBK等不同字符集。经评估测试分词准确率在 95% 左右,召回率有 92% 以上。 这套程序的开发其实很早就开始做基础工作了,持续时间和耗费精力都相当大。开始全部采用纯 php 代码编写,功能基本实...

46.RE: 关于SCWS基于HTTP/POST的分词API的一个问题

发布时间:2011-04-19 14:04 t By hightman

新版会开发一个API直接在函数里生成临时词库供调用。

47.RE: 弱弱地提问下 SCWS分词能不能选择保留原文空格?

发布时间:2012-03-09 08:03 t By qaz2883383

[quote='hightman' pid='8771' dateline='1330917695'] 不能,空格都略过了 [/quote] 谢谢管理回答 噢噢!~感觉如果可以保留的话会方便很多!~

48.在 Xunsearch 使用 SCWS

...在安装完 `Xunsearch` 后可以通过服务端内置的 scws[1] 实现分词, 而不需要另外再安装 scws 的 php 扩展。从 `1.3.1` 版本起,`Xunsearch` 的 PHP-SDK 中加入 [XSTokenizerScws] 类,可通过搜索服务端执行分词功能。 用法简单说明 ---------- 这...

49.使用自定义词库的时候,部分词会丢失

更新时间:2014-04-18 17:04 t By tianly

...是SCWS-1.2.2 我用自己的词库替换了dict.utf8.xdb,然后尝试分词“朝鲜近日播放的一个纪录片中,发现”,发现“纪录片中”在分词结果中丢失了 Array ( [word] => 朝鲜 [off] => 0 [len] => 6 [idf] => 0 [attr] => @ ) Array ( [word] => 近日 [off] => 6 ...

50.RE: scws1.1.2 安装错误

发布时间:2010-05-13 16:05 t By gaoomei

...能够正常的被php加载上去了。 但是现在有个问题是 无法分词,情况是这样的: 1. 按照统计形式分词,返回结果为空 2. 而按照非统计形式分词,结果是单字,没有词组。 3.回头去查,发现原来安装的另外一台32位的1.1.1版本的分...

  • 时间不限
  • 按相关性排序