搜索

大约有 48 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0055秒)

11.set_multi()复合分词问题

发布时间:2012-10-23 10:10 t By muzi1012

想请教下,假如我开启复合分词,在返回的分词结果里怎么区分哪些是复合分词的结果,哪些是平常的结果? 比如我对“中国人”分词,返回中国+人+中国人,怎么单独提取复合词 中国+人呢?

12.仍然是第一个例子的问题,怎么连“中国人”都没分出来?

发布时间:2013-04-14 15:04 t By zctr

例子: 我已经将文件存为ANSI形式了,编码的问题解决了。 可是,我发现分词不了。请看结果: Array ( [0] => Array ( [word] => 我 [off] => 0 [len] => 2 [idf] => 0 [attr] => un ...

13.仍然是第一个例子的问题,怎么连“中国人”都没分出来?

发布时间:2013-04-14 15:04 t By zctr

例子: 我已经将文件存为ANSI形式了,编码的问题解决了。 可是,我发现分词不了。请看结果: Array ( [0] => Array ( [word] => 我 [off] => 0 [len] => 2 [idf] => 0 [attr] => un ...

14.RE: 三个问题需要求教

发布时间:2011-01-18 21:01 t By hightman

只要 SCWS_MULTI_DUALITY 即可了。 SHORT 是指把“中国人”再细切为“中国”+“人” ZMAIN 是把其中的主要文字都切出来,比如“中国人”在其它切法的基础上再切出“中”+“国”+“人” ZALL 则所有文字,ZMAIN只会切出包含在词典中...

15.中英混合问题

更新时间:2012-10-16 19:10 t By o00ofly

...输入中英文确是可以混合的,比如关键词输入“我是test中国人”,在线分词会给出“我是 test 中国中国 国人 ”,这是什么情况呢? 我的环境是:win7+php5.4+scws的

16.RE: 请问一下,xdb与txt词库那个读取效率更高

更新时间:2013-06-29 23:06 t By 阿弟2013

...词是正确的分开了 postgres=# SELECT to_tsvector('zw_simple','pgsql中国社区论坛 http://www.pgsqldb.org:8079 chenaishen@263.net'); to_tsvector --------------------------------------------------------------------------...

17.libscws的问题

发布时间:2009-12-02 16:12 t By nftw

hightman您好: 我大致用README中提供的例子对 "我是一名中国的程序员"这句话,进行分词, 代码如下: [php] #include #include #include #include int main(int argc, char *argv[]) { scws_t s; scws_res_t res, cur; char *text;// = "...

18.Windows7 分词准确率极低

发布时间:2010-12-31 00:12 t By pittece

...可以顺利运行,但是分词成功率极低,比如输入: “中国航天官员应邀到美国与太空总署官员开会 发展中国家 上海大学城书店 ” 返回的是: “中 国 航 天 官员应 官员 员应 邀 到 美 国 与 太 空总署 空总 总署 官员开 ...

19.如何去除无用的词?

发布时间:2013-04-23 14:04 t By longjianghu

输入示例文字“我是中国人”,分词之后成了我是,中国人两个词,但是我是这个完全没有意义,如何去掉?

20.如何去除无用的词?

发布时间:2013-04-23 14:04 t By longjianghu

输入示例文字“我是中国人”,分词之后成了我是,中国人两个词,但是我是这个完全没有意义,如何去掉?

12345
  • 时间不限
  • 按相关性排序