搜索

大约有 30 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0065秒)

11.scws分词乱码问题,求解

发布时间:2012-07-17 16:07 t By wainilxx7

...。我对“调用 segment 方法执行词汇切割”进行分词,分词结果为“Array ( [0] => 璋 [1] => 冪 [2] => 敤 [3] => segment [4] => 鏂 [5] => 规 [6] => 硶 [7] => 鎵 [8] => ц [9] =>  [10] => 璇 [11] => 嶆 [12] => 眹 [13] => 鍒 [14] => 囧 [15] => 壊 ) ”,这感觉好...

12.XDB词典

发布时间:2011-08-06 11:08 t By elaine0604

我把从XDB词典文件中下载的GBK格式的词典,放在PSCWS23程序的词典文件中作为默认词典,然后我运行PSCWS23程序的demo文件输入内容后检测结果匹配不到。这是什么原因??:huh: 望各位高手不吝赐教,谢谢

13.C版简易中文分词-cscwsd-0.0.3 发布

发布时间:2007-06-06 10:06 t By hightman

...文字即可,每敲入一个回车,服务器立刻返回当前句的切分结果. 几条控制命令,在切分前设定(可不设) /set autodis=[on|off|yes|no] /set ignore_mark=[on|off|yes|no] /set delim=_ 统计词语出现频率?? /set stat=on (开始统计) /set attr=名词,动名...

14.“有空间”的分词有问题和扩充词典

更新时间:2013-05-18 14:05 t By lyjkensou

...用的是scws-1.2.1 对“有空间”这个句子进行分词,理想的结果应该是“有空 空间” 但实际结果是“有空 间” 即使通过scws_add_dict()添加了自定义的txt字典(里面只包含“空间 11.82 12.38”一行),仍然分不出“空间”这个词。 ...

15.RE: 关键字完全匹配的如何增加权重?

发布时间:2012-11-05 21:11 t By Dull

我来复述下我的建议 {title}实际名称 {start}自定义前缀 {end}自定义后缀 入库时候{start}{title}{end}的格式 查询时候根据{start}{end}计算步长,得出最符合需求的结果,需要对search.php做比较多的修改

16.RE: 使用SCWS的libscws C源码,测试分词不成功

发布时间:2014-01-03 10:01 t By banderuilq

我知道我的问题出在哪了,我把这个文件存储为UTF8格式的文件就好了,输出结果就正常了。

17.RE: libscws的问题

发布时间:2009-12-04 13:12 t By nftw

[quote='hightman' pid='3417' dateline='1259892522'] 从结果看应该是 scws_set_dict(s, "/usr/local/etc/dict_chs_gbk.xdb", SCWS_XDICT_MEM); 这句话出了问题, 也就是可能词典不正确. 但这个词典目前测试在64位系统下也是可以正常工作的, 检查一下词典的字...

18.RE: xunsearch-1.4.5 (基于 xapian 和 scws开源中文搜索引擎,高扛压不死锁)

发布时间:2013-03-28 12:03 t By vus520

...的问题是想通过XSTokenizerScws来获取指定文本的自定义分词结果。sdk使用了github里最新的版本,词典格式由一楼所示,现在取出来的结果并不包含任何自定义词典的关键词,求解。[/code] [php] $text =

19.RE: xunsearch安装完成后运行示例错误

更新时间:2011-09-14 09:09 t By nick

...下,看上去你的PHP似乎 不支持 __toString() [/quote] 检查结果如下: [root@localhost php]# util/RequiredCheck.php 'Xunsearch PHP-SDK 运行需求检查 检查内容 -------- 本程序用于确认您的服务器配置是否能满足运行...

20.项目配置文件详解

...”。 例如:搜索 `XXX YYY` 表示在混合区检索,返回的结果可能是 title 也有可能是 body 字段符合匹配; 而搜索 `title:XXX` 则表示仅检索 title 匹配 XXX 的数据。每个字段可以指定的索引方式的值如下: - none 不做索引,所有...

123
  • 时间不限
  • 按相关性排序