[quote='hightman' pid='3651' dateline='1280386137'] 关于has_word, 不是很明白你的意思, has_word 用于检测当前文本中是否包含这些属性的词。 scws_get_words 是按词性返回分词结果,标点的词应该默认应该是 un 或 # 之类可以自行排除。 [/quote] ...
...库里有这样的几条数据: 1、AA制生活好吗? 2、生活是什么 3、我们的幸福生活 我搜索“生活”的时候,希望:“生活”出现在最前面的权重最高,排在最前面。 也就是期望上面的排序结果是:2 1 3 请问有办法实现吗...
...== 如之前所说,我们所有的索引分词器默认为 scws,这也是我们开发的开源分词系统, 内置的词库基本上能满足绝大多数应用。但总有例外,这也就是即将说的如何自定义词库。 全局自定义词库 ------------- 这是针对同一个 `xu...
原来是这样,分库倒是个不错的主意。自己根据条件决定要不要 addDb() 我担心的是通过 value 匹配才导致的慢,比如 addRange() 调用 或 setFacets()
...uote='llkk0914' pid='4262' dateline='1371959040'] 你调换服务器了, 是不是之前的搜索记录没有拿过来, 搜索建议应该是根据搜索的log来的吧 [/quote] 难道真的是吗?我竟然把原来数据库上的传到另外一个服务器上,运行成功了,晕! 谢谢...
... } s->off = off; return cnt; }[/quote] 如果xattr是NULL,返回的将会是0 另外,scws_get_words返回的包括标点,不知道是否是设计的原意? [/quote] 主要是while循坏里面,如果变量at为NULL, “cnt=1”就永远不会执行。
多谢建议。这个部分要做得精准的话其实是比较尖端的,SCWS分词后有提供一些热门词排序,如果简单归结为标签也是不妥的,我觉得需要有标签库进行匹配和比对。
总数是估算的。 条件越简单就越接近实际。 你试试百度和google,这个也是解决不了啊。 一万棵树上有多少枯叶呢? 先取出三五棵对,数算一下,再计算。这就是估算。 一万棵树上的树龄在5-10年的树上有多少枯叶呢? 再计算...
...长 [/quote] 我的搜索语句你也看到了 绝对没有超过80.但是报错 Data/Name too long 这就是说是Name 太长 而我的搜索语句是六个”self 字段索引“ 当我尝试只搜索4个“self 字段索引”的时候就不会报错,是不是讯搜本身对”self 字段...