开源免费、高性能、多功能、简单易用的全文检索技术方案 !

搜索

大约有 546 项符合查询结果，库内数据总量为 3,513 项。（搜索耗时：0.0051秒）

61.RE: 塔里木河的分词问题

发布时间：2013-06-09 13:06 t By hightman

因为“塔里木河”已经是个完整的词了，再细切也是“塔里+木河”。实在有必要可以自定义分词器或想办法将你要的词加入到索引中。

62.请教：关于地市信息的分词结果，如何更准确？

发布时间：2010-09-21 12:09 t By shallows

我使用scws的C版本提供的接口对省份、地市信息进行分词，发现分词的结果有时不是希望达到的结果。例如： 1 洛阳市廛河华林水席村希望的结果为：洛阳市廛河华林水席村（词典中有洛阳市，市廛，河华，华林）实...

63.英文数字组合字符串分词问题，已结贴。

更新时间：2014-05-14 10:05 t By hpxl

华硕主板H61-PLUS，想分词结果中包含H61。通过 [url=http://www.xunsearch.com/scws/demo/v48.php]http://www.xunsearch.com/scws/demo/v48.php[/url] 得到的结果为“华硕/主板/H/61/-/PLUS”。尝试过自定义词库，$prefix/data/项目名称/dict_user.txt 加入H61，但是...

64.支持英文分词吗？和Sphinx有性能对比吗？

发布时间：2014-04-10 20:04 t By beyondbobo

支持英文分词吗？和Sphinx有性能对比吗？

65.求助scws分词bug

发布时间：2014-04-22 15:04 t By zhoutian

在使用scws分词的时候，如果输入40多个“卡”字，最后分出来的那个词少了一个字节，就是说在utf8下原本3字节的一个“卡”字，变成了两个字节，形成了一个乱码。在线测试也会出现这种情况，大家怎么解决啊？？？

66.RE: 英文与数字组合词分词错误

发布时间：2014-04-23 10:04 t By tenjin

C++版本和官网演示分词不一致。 ".mp3"，在线演示切分成". mp3",C++版本 1.22切分为". mp 3";

67.请问SCWS可以做英文分词么？

发布时间：2014-11-18 14:11 t By angelhater

我想对打断的英文做分词，utf-8，scws可以用么？应该下载哪个版本呢？PSCWS4 说是速度慢，不推荐使用，而PSCWS23 仅支持GBK字符集

68.RE: 二元分词问题

发布时间：2011-11-16 11:11 t By hightman

...kenizer 类，然后根据自己需要生成 tokens 就可以了。二元分词并不是直接分成N长的若干段，而是 ABCD => AB + BC + CD 你的作法会把 ABCD => AB+CD 这样搜索 BC 就搜索不到了。。。

69.ubuntu 64位无法分词

发布时间：2013-11-05 12:11 t By luopuya

ubuntu13.04是用amd64.iso在虚拟机里安装的分词几乎都是un 而在另一个32位ubuntu上则正常字典是完好的的xdb 顺便问下有无txt格式的字典下载，用scws_gen_dict生成不知道行否

70.RE: 遇到一个分词错误的问题

发布时间：2014-02-25 11:02 t By robinjia

又一个分词错误。将“你用余额宝吗？为什么有人讨厌余额宝?”分成了你 /r 用 /v 余额 /n 宝吗 /nr ？ /un 为什么 /r 有人 /r 讨厌 /v 余额宝 /nz ? /un