搜索 - 迅搜(xunsearch) - 开源免费中文全文搜索引擎

151.RE: 分词初试，结果不对

发布时间：2010-09-17 16:09 t By xiaowang19

事实上，我UTF-8的一直不成功，GBK的就会出现那样奇怪的问题今天我又再试了一下（GBK版本的），在Windows下，在文件保存的时候，选择编码“ANSI”，这样就不会出现那样奇怪的问题了

152.RE: 关于词典和分词

发布时间：2011-03-22 20:03 t By zfzeng

[quote='leeeboo' pid='4129' dateline='1300776583'] set_mutli() php扩展里是否有这个方法 Fatal error: Call to undefined method SimpleCWS::set_mutli() [/quote] 应该是set_multi(0)

153.发现有几种情况会导致分词不准确？

发布时间：2011-09-15 14:09 t By 逆雪寒

scws分词不正确的情况 1、中文夹杂连续两个以上英文或数字（例如：程jj序ii员e 正常，程jjj序ii员e 不正常） 2、英文数字组合中，同时含有连续一个以上英文或数字的组合（例如：w1156k 正常，w16ky不正常） 3、含有任意一个...

154.RE: 遇到一个分词错误的问题

发布时间：2014-02-11 14:02 t By robinjia

不知道还有没有其它更好的解决办法？不能改代码，也必须保留武这个姓。正在考虑加一条规则，可是我不懂那些词性语法规则的运作原理。

155.RE: 请问scws分词如何实现优先级

发布时间：2010-12-30 17:12 t By hightman

提升在词典中的 tf 值

156.RE: 如何获取到分词对应的id

发布时间：2011-01-30 13:01 t By hightman

不存在于词库中的所以没有idf啊，你说的是idf吗？

157.狂赞！很难想像居然会有如此简单易用的分词技术

更新时间：2012-04-22 02:04 t By duyipeng

早就对分词技术做过很多研究，但是却从没发现简单易用的产品，哪怕是收费的。今天无意中发现了FTPHP的SCWS，安装试用了下，非常棒！关键MMD还是开源免费的，能够自定义各种功能。强烈支持并持续关注！

158.RE: 对于分词的一些困惑

发布时间：2010-10-13 17:10 t By hightman

由于分词规则开头会先进行中英文粗分，那时就强行把数字、字母与多字节的汉字拆分开。只有夹在汉字中间的1～2个数字或字终才被允许和汉字组合，比如“T恤” ”Q币“ 这种。假设你的词典里有”北海36“，被分的句子是...

159.RE: 关于SCWS基于HTTP/POST的分词API的一个问题

发布时间：2011-04-19 15:04 t By tuzwu

...] 感谢管理员回复. 其实我的意思大概可以简化为: 最长分词模式. 分出来的词要达到符合语法的最长.这个难度估计不小,呵呵,也可能是比较不现实的需求. 自己架设scws分词库程序当然可以导入自己的词库,但是不是每个人都愿...

160.本地安装后，分词和v48.php演示不一致，求解？

更新时间：2014-11-27 13:11 t By 28302551@qq.com

在ubuntu12.04下安装了分词，php版本为5.5.19，scws版本1.2.2 http://www.xunsearch.com/scws/demo/v48.php（演示分词）与本地的分词效果不一样本地分词结果：陈凯歌并不是《无极》的唯一著作权人，一部电影的整体版权归电...

开源免费、高性能、多功能、简单易用的全文检索技术方案 !

相关搜索