搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

441.XSTokenizerScws的一个使用问题

发布时间：2013-01-29 10:01 t By tisswb

是这样的，我使用XSTokenizerScws进行分词 [php] $tokenizer = new XSTokenizerScws; $tk = $tokenizer->setIgnore(true)->setMulti(11)->getResult("是一"); print_r($tk); [/php] 结果是 [quote] Array ( [0] => Array ( [off] => 0 [attr] => m ...

442.从windows迁移到linux发生的问题

发布时间：2013-12-07 14:12 t By favii

...时发现以下怪现象：本人使用15000个左右的学校名称做分词测试，约1400条记录返回空白，其它则貌似正常，不知何故。比如：北京大学、中国人民大学返回空白，而清华大学、北京航空航天大学则正常。以下是php代码：

443.删除和添加一些新词

发布时间：2013-08-01 11:08 t By kimiduan

...仅为微软创收8.53亿美元，甚至不抵库存调整费用”进行分词，结果是“Surface/en 上一/nz 财/n 年仅/n 为/v 微软/nz 创收/v 8.53/en 亿/m 美元/q ，/un 甚至/d 不/d 抵/v 库存/n 调整/vn 费用/n ”。我在dict_extra.txt中添加了“财年 11.82 12.38 n”...

444.SCWS - 比如我要加入关键词 65Mn这种专业词怎么做

发布时间：2012-08-20 11:08 t By jason

比如我要加入关键词 65Mn 这种专业词怎么做 rules->specials 自定义分词都试过没法成功

445.RE: 关于自建字典问题

发布时间：2013-09-02 04:09 t By gwgwgw

...典就2个词，好纠结啊，纠结死啦，但是当我输入时还是分词为纠结|死了），求救啊！！还有帖子1中，字典的问题，生成的字典是因为无法载入而报错的，求高人相助啊！！

446.RE: 为什么不提供历史版本的下载呢

发布时间：2011-09-17 01:09 t By hightman

每次更新都是期望改进，而不是倒退呵。 1.1.2 目前已经放入 [url]http://www.ftphp.com/scws/down/scws-1.1.2.tar.bz2[/url] 供下载。您说的 1.1.2 在分词效果上比 1.1.8 还要好，可否指出哪几个实例？

447.RE: scws_has_word的逻辑问题

发布时间：2010-07-29 14:07 t By hightman

关于has_word, 不是很明白你的意思, has_word 用于检测当前文本中是否包含这些属性的词。 scws_get_words 是按词性返回分词结果，标点的词应该默认应该是 un 或 # 之类可以自行排除。

448.规则集BUG

更新时间：2014-08-22 17:08 t By shakeng

... = nz :include = chnum1,chnum2 :znum = 1,2,3 百分百分之[/b] 分词的时候出现以下问题：词：百分六识别正确词：百分六十识别失败，只能识别出”百分“和”六十“，无法识别为：”百分六十“ 词：百分六五识别失败，结...

449.RE: [特别发布] 纯PHP编写的xdb词典导入导出工具！！

发布时间：2010-03-29 17:03 t By sdzhxl

最近在做个项目,用到了分词,找了一下,发现这个,很好. 遇到一个问题, 命令导出xdb到txt,只导出了这个 # WORD TF IDF ATTR 请问这是咋回事

450.获取返回结果后如何处理

发布时间：2013-07-01 09:07 t By laiqn

...19999980926513671875;s:4:"attr";s:1:"n";}}} 我如何用php从中提取出分词结果，谢谢

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索