搜索

大约有 732 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.1949秒)

521.10秒 10元 这样的想做为一个词要怎么配置

发布时间:2011-10-28 17:10 t By xjtdy888

10秒 10元 这样的想做为一个词要怎么配置 ?? 我尝试了修改rule.ini但是不成功。如果数字是全角的话倒是可以成为词,但我同时也需要半角的数字+单位 作为一个词,

522.RE: 我想使用系统自动的分词功能,可是只看到有接口

发布时间:2011-11-28 11:11 t By hightman

对只要编译一下 scws 扩展就可以了。在 xunsearch-full-xxx 下面有 scws-1.1.8/phpext 在此目录下 phpize ./configure make && make install 即可,以上步骤根据不同用户权限略有不同。

523.Windows7 分词准确率极低

发布时间:2010-12-31 00:12 t By pittece

我安装了PSCWS4,然后再Windows上可以顺利运行,但是分词成功率极低,比如输入: “中国航天官员应邀到美国与太空总署官员开会 发展中国家 上海大学城书店 ” 返回的是: “中 国 航 天 官员应 官员 员应 邀 到 美 国 ...

524.RE: 讯搜怎么连接数据库的,没看到连接数据库啊?

发布时间:2014-05-05 15:05 t By bigxu

xunsearch不连接数据库的。 你可以把数据从"txt文件,pdf文件,oracle,mysql“等各类文件中,添加到xunsearch库中。

525.刚翻译了一下这个倒java上

更新时间:2011-02-22 10:02 t By mudie

...低 有需要java版本的联系我,qq44720124[hr] 另外,高人同学可以考虑下这几个问题: 1.词性参与权重计算导致的问题挺多,这点是不是考虑规则权重调整一下? 2.可能是考虑性能问题,采取的局部寻优的办法也导致了一些问题,...

526.RE: set ignore bug ?全角数字不见了

发布时间:2011-11-03 23:11 t By hightman

...个给去掉 [/quote] 那应该是2者的词典不一样吧。。。你可以试试在不IGNORE的情况 下打印词情。

527.RE: 冒昧的问一下——怎么用tf和idf来计算权重?

发布时间:2012-05-21 16:05 t By markmx

目前没有方法,我看只有采集 http://www.ftphp.com/scws/demo/get_tfidf.php 这个地址。 希望可以共享一下

528.RE: 我有10多万条用户搜索记录,导入到日志中,有什么用

发布时间:2012-02-20 16:02 t By hightman

如果是xunsearch搜索日志你不需要手动导入,它已经自动处理过了。 外部来的可以导,手册很明确指出搜索日志用于拼音建议、相关搜索。至于你所谓的精准度,似乎毫无关系

529.RE: 如何处理“小沈阳”这种模式的词句!?

发布时间:2010-10-28 11:10 t By hightman

...也不熟WIN平台,但有提供源码,如果你会弄就帮弄一下我可以在发布包中一并提供。 像你这样的情况因为“沈阳若”被识别为姓名了,这是一种比较难以决断的岐议,要说分成“小”“沈阳若”在美国语法上其实也是通顺的。 ...

530.RE: 索引到一大半的时候出错退出,有没有办法继续?

发布时间:2011-10-25 11:10 t By hightman

Indexer.php 你可以在 sql 语句中指定 offset 和 limit --sql="select * from cdb_posts limit 999999999999 offset 5000000" 类似这样,OFFSET 不能单用必须配合 limit

  • 时间不限
  • 按相关性排序