搜索

大约有 30 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0048秒)

1.麻烦站长解释一下“透过scws_get_result()取数据时自行排除单个字”

发布时间:2010-08-20 19:08 t By johnbaby

...,但是摸不着头脑是如何通过透过scws_get_result()取数据时自行排除... 还请站长指教一二,或者有经验的朋友指点一下啊。 非常感谢!

2.RE: 麻烦站长解释一下“透过scws_get_result()取数据时自行排除单个字”

发布时间:2010-08-22 00:08 t By hightman

返回的时候根据长度排除啊,GBK的话单字就是2字节,很好判断啊,UTF-8三字节,但也能判断出是不是一个单个的汉字

3.RE: 麻烦站长解释一下“透过scws_get_result()取数据时自行排除单个字”

发布时间:2010-09-10 14:09 t By johnbaby

[quote='hightman' pid='3685' dateline='1282406611'] 返回的时候根据长度排除啊,GBK的话单字就是2字节,很好判断啊,UTF-8三字节,但也能判断出是不是一个单个的汉字 [/quote] 原来如此。明白了。非常感谢!

4.RE: 如何使分词結果不包含一个單字的词?..

发布时间:2010-08-20 18:08 t By johnbaby

[quote='hightman' pid='3622' dateline='1278485881'] 目前没有这个内置选项,建议在透过scws_get_result()取数据时自行排除... [/quote] 建议在透过scws_get_result()取数据时自行排除... 不是很理解啊。麻烦站长解释一下啊。

5.RE: 请问索引分库单个库多大比较好?

更新时间:2012-04-09 19:04 t By Dull

...og 发现1.1开始自动分库了 这样子的情况下 还有没有必要自行分库? 最终我打算测试2.7亿条的数据库 差不多是600G的xs数据库大小 自动分库能满足不?[hr] 补充下 http://www.xunsearch.com/doc/php/guide/start.changelog 发现1.1开始自动分库...

6.词典格式疑问?

发布时间:2010-12-10 00:12 t By lauxinz

...", "词性", 字段时间用空格或制表符分开,数量不限,可自行对齐以美化。[/quote] “词语"为什么会有3个字母的限制呢?,比如词语“java”。这个限制是不是已经废弃了?[/u]

7.请问包里怎么没有utf-8编码的词典和rule文件

发布时间:2008-02-16 11:02 t By icesyc

gbk的测试已经通过,UTF-8的词典可以自行修改吗?

8.RE: 使用工具导出xdb后出错

更新时间:2011-09-23 13:09 t By hightman

这些 PHP 工具在发布时都有测试通过,但PHP版本众多,加上各自配置又不一样,所以难免还有问题。目前 PHP 的工具部分照顾不过来,请尝试自行修正一下。 计划在下一版本中直接在 gen-scws-dict 中提供C版的工具,不要再通过PHP了

9.RE: 如何使分词結果不包含一个單字的词?..

发布时间:2010-07-07 14:07 t By hightman

目前没有这个内置选项,建议在透过scws_get_result()取数据时自行排除...

10.RE: scws_has_word的逻辑问题

发布时间:2010-07-29 14:07 t By hightman

关于has_word, 不是很明白你的意思, has_word 用于检测当前文本中是否包含这些属性的词。 scws_get_words 是按词性返回分词结果,标点的词应该默认应该是 un 或 # 之类可以自行排除。

123
  • 时间不限
  • 按相关性排序