我用的是 "陈凯歌并不是《无极》的唯一著作权人,一部电影的整体版权归电影制片厂所有" 这段话,不知道为什么就只能分割出来陈凯歌,如果是分词没起作用的话就不会分割出陈凯歌的,这到底是为什么呢?麻烦高人帮帮我吧
...----------------------- 01. 权利 nr 7.00(2) 02. 陈凯歌 nr 3.50(1) 03. 包括导 nr 3.50(1) 04. 权人 nr 3.50(1) 05. 权归电 nr 3.50(1) 06. 成小 nr 3.50(...
...装的不一样的呢? 在说第三点: 删除词条: 输入:陈凯歌是个帅哥吗 我限制了删除了 陈凯歌 但是实际没有效果啊, 代码可以直接查看,限制词典位置在: http://sjz.haojishu.com/tools/dict_extra.txt 见鬼啊!
我电脑APACHE+PHP 4GB内存 E6300处理器 PHP简易中文分词(SCWS) 第4版(GBK) 在我电脑上用你默认的分词内容"陈凯歌并不是..." 第一次0.8xxxs 第二次0.098711013793945 而你们演示的就快多了 0.0039410591125488 为什么差距这么大?
陈凯歌并不是《无极》的唯一著作权人,一部电影的整体版权归电影制片厂所有。 一部电影的作者包括导演、摄影、编剧等创作人员,这些创作人员对他们的创作是有版权的。不经过制片人授权,其他人不能对电影做拷贝、...
...即可 3. dict_extra.txt 也必须是UTF-8编码 4. 删除词条,因为陈凯歌其实可能是因为人名关系导致切成词,可能会不受词典影响 5. 如果你非要用gbk 源码中 set_charset() 的参数就为 'gbk' 或默认的不要加上 'utf8'
...分词结果如下: ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 陈凯歌 并 不 是 《 无 极 》 的 唯 一 著 作 权人 , 一 部 电 影 的 整 体 版 权归电 影 制 片 厂 所 有 。 一 部 电 影 的 作 者 包括导 演 、 摄 影 、 编 剧 等 创 作 人 ...
...即可 3. dict_extra.txt 也必须是UTF-8编码 4. 删除词条,因为陈凯歌其实可能是因为人名关系导致切成词,可能会不受词典影响 5. 如果你非要用gbk 源码中 set_charset() 的参数就为 'gbk' 或默认的不要加上 'utf8' [/quote] 我那个演示页...
...演示分词) 与本地的分词效果不一样 本地分词结果: 陈凯歌 并 不 是 《 无 极 》 的 唯 一 著 作 权人 , 一 部 电 影 的 整 体 版 权归电 影 制 片 厂 所 有 。 一 部 电 影 的 作 者 包括导 演 、 摄 影 、 编 剧 等 创 作 人 员 ...
...演示分词) 与本地的分词效果不一样 本地分词结果: 陈凯歌 并 不 是 《 无 极 》 的 唯 一 著 作 权人 , 一 部 电 影 的 整 体 版 权归电 影 制 片 厂 所 有 。 一 部 电 影 的 作 者 包括导 演 、 摄 影 、 编 剧 等 创 作 人 员 ...