通常英文是不需要分词的,但很多时候词性是需要的,比如nike,dior这类品牌英文。 目前默认词性都是en,有什么办法可否自定义词典来改变他的词性。 还有个问题,就是纯数字的词性为什么是en呢,不是m? 望赐教。
终于找到一个自动分词系统,由于不能确定服务器是否加载这个分词的dll文件 则使用PSCWS4进行使用 可是pscws4类中并没有add_dict函数 我用set_dict设置自己自定义字典.txt文件 一直报错 这个怎么解决 就是加载自定义的txt字典 thank u
其实我们提供的搜索方案是提供API的,简单来说就是你可以通过API维护数据。至于如何同步完全取决于你的作法和设计,至于JOIN也一样,这个本身不是XUNSEARCH的功能 但我们提供的辅助工具 Indexer.php 也支持 JOIN语句和多表导入。
比如说我要切割“Adidas/阿迪达斯是一个著名的运动品牌” 在自定义词库里我添加了"Adidas/阿迪达斯" 但结果是Adidas / 阿迪达斯 请问能否判断是一个自定义的整词吗?就是说按我设置的词库来分
首先索引更新并不是实时刷新的,你稍后再看。 如果用 XSIndex::add 一样是调用多少次数据库内就是多少条的
...行这个$xdb->Optimize();要等很久... 能不能周期性的优化? 就是新加的差不多数量了比如100个了就手动执行一次$xdb->Optimize();? 是否可以这样呢?
平滑重建意思就是: beginRebuild() 调用后就在服务端做一个标记,原数据库不变。db 然后接下来所有的 add/update/del 操作全部写入临时数据库。db_re 直到调用 endRebuild() 这时会把 db 改为 db_o,再把 db_re 改为 db 然后清除标记恢复正...
[quote='vist2007' pid='314' dateline='1323228655'] [quote='askie' pid='312' dateline='1323228058'] 我也遇到了同样问题! [/quote] 把type 设置成为 string 貌似是一种变通的方法 [/quote] 但是就无法排序了!这个是关键!要他就是为了排序的!