搜索

大约有 20 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.2914秒)

1.如何接入word/excle/pdf或ppt等相关文档呢?

发布时间:2012-08-13 09:08 t By sandand

如何接入word/excle/pdf或ppt等相关文档呢? 就是如何将这些文档中的内容作为搜索的对象,进行索引、关键词搜索等 有没有高手回答一下,如何做?多谢啦!!!!

2.RE: 如何接入word/excle/pdf或ppt等相关文档呢?

发布时间:2012-08-13 21:08 t By hightman

需要借助第三方工具转换为纯文本

3.RE: 如何接入word/excle/pdf或ppt等相关文档呢?

发布时间:2012-08-16 15:08 t By sandand

有具体的办法吗?请指教啊,多谢啦!!!! 给个具体建议也行

4.RE: scws_has_word的逻辑问题

发布时间:2010-08-08 02:08 t By hightman

谢谢,是文档写错了。当时可能是直接复制get_words的说明进行修改,改漏了。

5.搜索日志管理问题

更新时间:2014-04-26 10:04 t By smarteng

...除掉 http://www.xunsearch.com/doc/php/guide/util.logger 看了这个文档,发现比较好操作 # 删除 demo 项目中 搜索日志词 word util/Logger.php --del=word demo 这样就可以了, 可是现在有个问题,搜索日志里面有一个是乱码 我该如何删除呀...

6.RE: scws_has_word的逻辑问题

发布时间:2010-08-05 15:08 t By backluck

...系呢,AT为NULL时返回0也合乎情理啊。 [/quote] 但是这跟文档的描述有出入啊。 [quote] ·int scws_has_word(scws_t s, char *xattr); 描述:判断text中是包括指定的词性的词汇。参数 xattr 用来描述要排除或参与的统计词汇词性, 多个...

7.scws_set_multi复式分割无效

更新时间:2011-11-03 17:11 t By xjtdy888

...indows .dll测试是可以正常的。 以下是测试代码,是在你的文档例子代码上加入了 scws_set_multi(s , 1); [code] #include #include main() { scws_t s; scws_res_t res, cur; char *text = "上海市"; if (!(s = scws_new())) { printf("error, can't init the scws_t!\n"); ...

8.关于scws和词库的一些建议

更新时间:2011-04-23 21:04 t By lauxinz

...另外有两个模糊的地方: (1)词库中词性'#'含义不明确,文档说:# : 表示对应的词是符号系列的单字,没有实际意义,比如日本的假名符号。这类词是不会返回的。 但实际把一些字的属性定义为#,仍然会返回。 (2)命令行工...

9.载入txt词典所出现的BUG

更新时间:2011-08-09 12:08 t By 999

a.txt文档内容: # WORD TF IDF ATTR 印第安那 13.30 15.98 ns 印第安那州 12.72 11.56 ns 印第安那波利斯 12.31 12.68 ns [php] $txt = '我名字叫印第安那,我的家乡是印第安那州的印第安那波利斯!'; $so = scws_open(); scws_set_charset($so, 'gbk'); s...

10.求解释TF/IDF计算器中get_tfidf的算法

发布时间:2013-10-30 11:10 t By jjyang

...Url依然使用的baidu,如下: // 获取语料库中包含该词的文档数 function get_count( $corpusUrl, $word) { $url = $corpusUrl . urlencode($word); $data = @file_get_contents($url); if (!$data) return -1; $pos1 = @strpos($data, "百度为您找到相关...

12
  • 时间不限
  • 按相关性排序