新增索引和更新索引速度好慢好慢。 基本都在分钟级别,有的甚至3-4分钟。这是为何? 项目只要求对content字段检索,其他字段都不需要参与检索和分词。 帖出我的配置文件: [tweetId] type = id tokenizer = none [content] type = b...
分词 对于 词库 里有宝马x6 分词 为宝马和马x6 分词有问题 词库 里 只能添加 宝马 不能宝马x6 (中文 英文和数字在一起 存在分词问题) #解析后的 QUERY 语句:Xapian::Query((奥迪a6:(pos=1) SYNONYM (奥迪:(pos=89) AND 迪A6:(pos=90))))
ZENDCORE 这个介绍就不多说了。 我估计是由于ZENDCORE是PHP-CGI运行模式。所以应该是NTS。所以不支持。 加载了还是一直提示找不到文件。 [undefined=undefined]Note: Extensions marked with a symbol '!' indicate that an inconsistency occurred between the s...
词库可以添加 宝马x6 的啊
...实在不行自己加断点简单调试一下。 [/quote] 我知道,不能用于PSCWS23里的词典。可用于 SCWS-1.x.x 和 PSCWS4. 但是同样是XDB格式,我想导入导出PSCWS23下的XDB词典又怎么办呢?谢谢你的回答和免费提供学习。[hr] SCWS-1.x.x 和 PSCWS4 的...
这两天发现 fastrestart 竟然也不能启动它了,是否可以在xs-search启动的时候记录下它的pid fastrestart 时如不能正常启动过,先kill掉这个pid 再启动它呢
问问为啥我搜索 lili123可以出结果 lili12却不能呢? 还有 数据是12345678 我搜索345却也不能出结果!为啥?? 默认的分词也不行,:huh::huh:我用csv导入的 中文全都不可以搜索和显示出来 [id] type = id [user] index = both tokenizer = fu...
...词非常准确,基本能满足需求,美中不足的是: 25吨,16千克 不能分成整体的词,如果把25吨放入词库确实也能解决问题,只是现实中可能有5~1000吨,总不能一个一个都放进去,所以还是建议在算法上增加此功能比较理想
...比如hip pop这样也是一个名词,那现在自定义词典里肯定不能有空格的啊。老大能不能把这个也解决一下,这样的话,大家一起提供英文的词典,是不是就可以解决中英文混合分词了??
...员对他们的创作是有版权的。不经过制片人授权,其他人不能对电影做拷贝、发行、反映,不能通过网络来传播,既不能把电影改编成小说、连环画等其他艺术形式发表,也不能把一部几个小时才能放完的电影改编成半个小时就...