[quote='hightman' pid='3550' dateline='1273972998'] 没有什么太大的问题,但必须存一个冗余字段。以前就有建议过一些朋友这么做。 还有,MYISAM内置的全文也只是一个简单的解决方案,最终效果可能也不是非常好,根据以前的测试50万...
...5) 参数limit,设置分词数上限,可否不控制上限?参数是什么 其二: set_ignore(bool yes) 参数:true的话,表示忽略标点,但是实测中好像' "这种标点是无法忽略的, 如在我使用中会切出 Napoleon's 这种词。所以想具体了解下这...
...词也有问题. 我喜欢/n 吃/v 康师傅/n 牛肉面/n[hr] 大概知道什么原因了,我爱,我喜欢都在词库中标注为名词n 我爱 14.71 4.59 n 我喜欢 14.90 4.82 n 请问是词库有问题还是故意这样标注的?[hr] 你 1.28 0.00 r 我 1.28 ...
我在我的平台上反复测试过,完全没有这样的情况。改什么就是什么,前提是确定你的txt文件确实被成功修改了。 你建议你在 test.php 里的 scws_new() 之前加一句: echo "dict content: \n"; echo file_get_contents('/data/html/365search/dict.film.txt')...
又是一些分词错误. "一天都坐在办公室,有什么好的 活动方法能防止手脚冰冷"分成”一/m 天都/ns 坐在/v 办公室/n ,/un 有/v 什么/r 好/a 的/uj 活动/vn 方法/n 能/v 防止/v 手脚/n 冰冷/z“,其中的“天都”不合理; ”租房合同上标明...
...分类名和数据条数组成的数组, 但是接下来 分类名 加上什么样的连接 并且搜索页面在做些什么处理 才能使 点击分类名 搜索出来的为该分类下的数据。
[quote='hightman' pid='7573' dateline='1325211638'] 不知你在说什么。英文不需要词典啊!! [/quote] 我知道英文不需要词典 关键就是这个不需要词典 他的英文分词就没办法控制了,比如我要做计算机专业的分词,其中很多就需要用到一...
...buy_stat] => � [sell_stat] => � [collect_stat] => � 求: 1.什么方法可以列出所有文档? 2.什么方法可以改变乱码?
...cws, see 'setup.log' for more detail 没配置xapian-core-scws 这个是什么问题啊?? 找了一天了,搜索了一天了实在找不出原因,求高手解答....有朋友说是没分词库,安装包中不是有scws包? 这个是什么原因在线等
是判断指定词性 我自定义词库格式如下: 销售什么 1.0 1.0 * 出售什么 1.0 1.0 * 出售各式 1.0 1.0 * 某词 1.0 1.0 * scws_t s=scws_new(); 用下面这个函数可以分出“某词”, scws_get_tops(s,1000,N...