...不就好了? xunsearch 本身并不是完整的搜索引擎,它是提供核心组件并附带一些例子 [/quote] 如果是页面结构相似的网页,像H大这样做更好。
我使用mysql来管理词库,使用enum类型设置attr字段,将提供的xdb格式词库导出,发现存在以下非北大标注标准中的词性: 'df','jb','mq','rr','rz','iv','ld','ln','lx','in','jb','jn','qd','qe','uj','un','vi','vq' 这些应该都算是标注不正确的吧 还有...
多谢建议。这个部分要做得精准的话其实是比较尖端的,SCWS分词后有提供一些热门词排序,如果简单归结为标签也是不妥的,我觉得需要有标签库进行匹配和比对。
...索约369亿,baidu的这个估值是不是偏低了?我用咱们网站提供的TF/IDF计算器计算词库中的词,发现TF/IDF已经有明显变化,距上次更新已经过了10个月,变化还是非常明显的。hightman预计多久会更新一次词库? 最后,我对github上...
...索约369亿,baidu的这个估值是不是偏低了?我用咱们网站提供的TF/IDF计算器计算词库中的词,发现TF/IDF已经有明显变化,距上次更新已经过了10个月,变化还是非常明显的。hightman预计多久会更新一次词库? 最后,我对github上...
这些 PHP 工具在发布时都有测试通过,但PHP版本众多,加上各自配置又不一样,所以难免还有问题。目前 PHP 的工具部分照顾不过来,请尝试自行修正一下。 计划在下一版本中直接在 gen-scws-dict 中提供C版的工具,不要再通过PHP了
http://bbs.xunsearch.com/showthread.php?tid=122 ,根据上边链接里提供的资源,我可以成功搭建分词demo,但是不能进行demo的测试,好像是技术层面上缺少相关的函数,我可以联系咱们的技术具体谈一下吗,看到我的信息请联系我。我现在...
http://bbs.xunsearch.com/showthread.php?tid=122 ,根据上边链接里提供的资源,我可以成功搭建分词demo,但是不能进行demo的测试,好像是技术层面上缺少相关的函数,我可以联系咱们的技术具体谈一下吗,看到我的信息请联系我。我现在...