可以跟据词性在分词后自己过滤
中英混合的词目前最多只支持2个字母
分词过程中有一点奇怪的错误,如下: 输入:跑马的时候非常的卡 输出:跑马 | 的 | 时候 | 非常 | 的卡 输入:求最新的卡怪物方法 输出:求 | 最新 | 的卡 | 怪物 | 方法 输入:这个副本可以单刷也可以组队去打 输出:...
你可以自定义词库,去掉“的卡”,加入“单刷”
修改附带提供的 txt 词典,然后调用 cli/gen-scws-dict 生成词典
了解 多谢指教
请问下 我分了一个句子“小明从前门进来” 分成了 小明+从前+门+进来 请问该怎么调整“从前”和“前门”的词频才能正确的分出这句话呢? 还有那个TF-IDF两个权值是什么意思 怎么用
顶上去 希望给个回复 谢谢啊
问题解决了 多谢highman 也算是我帮助改进咱们这个系统了 。。