分词 对于 词库 里有宝马x6 分词 为宝马和马x6 分词有问题 词库 里 只能添加 宝马 不能宝马x6 (中文 英文和数字在一起 存在分词问题) #解析后的 QUERY 语句:Xapian::Query((奥迪a6:(pos=1) SYNONYM (奥迪:(pos=89) AND 迪A6:(pos=90))))
词库可以添加 宝马x6 的啊
我使用mysql来管理词库,使用enum类型设置attr字段,将提供的xdb格式词库导出,发现存在以下非北大标注标准中的词性: 'df','jb','mq','rr','rz','iv','ld','ln','lx','in','jb','jn','qd','qe','uj','un','vi','vq' 这些应该都算是标注不正确的吧 还有...
不好意思。。这一阵忙着毕业 很久没来看了。。 问题是, 我在添加了自定义的词库之后, 哪怕里面一个词都没有, 也是一个词都分不出来阿
怎么创建词库啊? 就比如说官网那个discuz的实例,这个是怎么跟数据库相关联的呢? 总不能如下那么创建吧,而且这个创建了是存到那里了呢? $data = array( 'pid' => 234, // 此字段为主键,必须指定 'subject' => '测试...