我用的是 "陈凯歌并不是《无极》的唯一著作权人,一部电影的整体版权归电影制片厂所有" 这段话,不知道为什么就只能分割出来陈凯歌,如果是分词没起作用的话就不会分割出陈凯歌的,这到底是为什么呢?麻烦高人帮帮我吧
...,这个文件读取后放在临时目录,建议不要太大,但我不知道多大才叫大,可否有个具体数据指导? 另外,这些新词,我通过官方提供的get_tf.php查询了一百个词,发现: 12.38 < tf
[size=x-large][size=medium]搜索出来的最后一条记录显示的标题是错误的,不知道是怎么回事。。。是bug还是我代码写的不对呢?-求解。 谢谢! 代码如下,$data为提交的索引
...方案啊,给你API你想怎么导入就怎么导入。 [/quote] 我知道啊,就是试了一下,感觉搜索速度还是不够,想看看其他的方案,因为xunsearch是scws+xapian,就想看看有scws+sphinx的方案。 我600多万的数据,4G内存,搜频率高一点的词...
...太老了,很多词语都没有。我想自己扩充我的词库,但不知道TF/IDF如何获得。 通过你提过的新词生词的TF/IDF计算器(http://www.xunsearch.com/scws/demo/get_tfidf.php) 结果计算出来的大部分内容都是一样的值,而且也无法用于分词。 ...
...太老了,很多词语都没有。我想自己扩充我的词库,但不知道TF/IDF如何获得。 通过你提过的新词生词的TF/IDF计算器(http://www.xunsearch.com/scws/demo/get_tfidf.php) 结果计算出来的大部分内容都是一样的值,而且也无法用于分词。 ...
...入xunsearch啊? 给个例子就好了,我一点也不懂,就不知道往哪个方向找,哪位大神稍微教一下?谢谢了~~ 如果能给个示范代码就万分感激了
...ct('/usr/local/scws/etc/dict.xdb'); $cws->send_text('我爱看电影,不知道电影院里有什么?'); 分词的结果竟是:“我 爱 看 电 影 , 不 知 道 电 影 院 里 有 什 么 ? ” 这到底是怎么回事呢,安装过程都很顺利呀!就是不能正...
...使用 SCWS(简易中文分词) 基于HTTP/POST的分词的API 但是不知道怎么调用,我用这个方式调用API,结果显示在网页上,我要如何调用才能将结果获取下来呢?比如我能将结果直接存在一个变量中,寻求指点,谢谢!
首先惭愧今天才知道scws这么好的项目。。 -________- 。。 最近有个PHP项目需要用到中文分词。。辗转很久来到了这里。。 在本机安装也很顺利,。 不过。。编码用的UTF8 按照文档里面的demo也自己做个小东西。。试试。。。...