搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

41.RE: SCWS不支持英文和中英文混合分词吗？

发布时间：2010-08-27 10:08 t By hightman

除中文外其余的只按标点符号或空格切分，无缝连在一起的单词字母是不支持的。

改成这样，scws_open 本身是没有函数的，文档是正确的，但附带提供的 scws.php 写错了，所以如果 ini_get('scws.default.charset')是utf-8那么就会按utf-8来，所以应该显式的调用 scws_set_charset() $cws = scws_open(); scws_set_charset($cws, "gbk"); scws_set...

43.RE: Hightman您好，我的分词怎么不对啊

发布时间：2010-08-19 09:08 t By assad

$cws = scws_open("gbk"); scws_set_dict($cws, "./etc/dict.xdb"); scws_add_dict($cws, "./etc/s.txt",SCWS_XDICT_TXT); scws_set_rule($cws, "./etc/rules.ini");

44.RE: 使用SCWS的libscws C源码，测试分词不成功

发布时间：2014-01-03 10:01 t By banderuilq

我知道我的问题出在哪了，我把这个文件存储为UTF8格式的文件就好了，输出结果就正常了。

45.2007简易分词第4版(scws-0.1.x)体验

发布时间：2007-06-06 11:06 t By hightman

...专名自动识别，也支持UTF-8/GBK等不同字符集。经评估测试分词准确率在 95% 左右，召回率有 92% 以上。这套程序的开发其实很早就开始做基础工作了，持续时间和耗费精力都相当大。开始全部采用纯 php 代码编写，功能基本实...

46.RE: 关于SCWS基于HTTP/POST的分词API的一个问题

发布时间：2011-04-19 14:04 t By hightman

新版会开发一个API直接在函数里生成临时词库供调用。

47.RE: 弱弱地提问下 SCWS分词能不能选择保留原文空格？

发布时间：2012-03-09 08:03 t By qaz2883383

[quote='hightman' pid='8771' dateline='1330917695'] 不能，空格都略过了 [/quote] 谢谢管理回答噢噢！~感觉如果可以保留的话会方便很多！~

48.在 Xunsearch 使用 SCWS

...在安装完 `Xunsearch` 后可以通过服务端内置的 scws[1] 实现分词，而不需要另外再安装 scws 的 php 扩展。从 `1.3.1` 版本起，`Xunsearch` 的 PHP-SDK 中加入 [XSTokenizerScws] 类，可通过搜索服务端执行分词功能。用法简单说明 ---------- 这...

49.使用自定义词库的时候，部分词会丢失

更新时间：2014-04-18 17:04 t By tianly

...是SCWS-1.2.2 我用自己的词库替换了dict.utf8.xdb，然后尝试分词“朝鲜近日播放的一个纪录片中，发现”，发现“纪录片中”在分词结果中丢失了 Array ( [word] => 朝鲜 [off] => 0 [len] => 6 [idf] => 0 [attr] => @ ) Array ( [word] => 近日 [off] => 6 ...

50.RE: scws1.1.2 安装错误

发布时间：2010-05-13 16:05 t By gaoomei

...能够正常的被php加载上去了。但是现在有个问题是无法分词，情况是这样的： 1. 按照统计形式分词，返回结果为空 2. 而按照非统计形式分词，结果是单字，没有词组。 3.回头去查，发现原来安装的另外一台32位的1.1.1版本的分...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

搜索