搜索

大约有 182 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.2942秒)

41.RE: 请问一下自定义TXT词组怎么做啊?有这方面的说明资料吗?

发布时间:2011-05-04 22:05 t By hightman

http://www.hightman.cn/bbs/showthread.php?tid=712 里面有解释啊

42.RE: 为何导出txt,里面内容不动在创建XDB之后速度变慢很多很多

发布时间:2011-03-10 21:03 t By hit

[quote='hightman' pid='4093' dateline='1299644984'] 导出的TXT格式的顺序并不能说明什么。。。。 [/quote] 那么会在什么环节出了问题呢? 为什么官方的比自己打包的快很多? 非常想知道答案 效率第一 = = 是不是要用 gen_dict.c 创建XDB比...

43.RE: 自定义的 txt 字典 有关问题 求助

发布时间:2010-04-09 15:04 t By hightman

那个属性对分词效果有一定影响的,TF主要用于词的切分,IDF用于统计,词性就用在取TOP时过滤或标注上。 最好是基于现有的词典去补充,你重建一个的话数据又都没有效果可能会比较差。SCWS主页上有一个TF/IDF计算器,你可...

44.RE: scws 词库与dict_user.txt文件有什么关系?

发布时间:2012-04-19 14:04 t By 290977824@qq.com

问题是,我在现存的词上创建同义词,也不是无效的!!!不得不采用index search 的or 语法

45.自定义词库dict_user.txt多大为宜

发布时间:2012-04-28 15:04 t By yunxiaoad2

还有,现在自定义了几个词库,分别是9M、7M,24k 看到文档说,这个文件读取后放在临时目录,建议不要太大,但我不知道多大才叫大,可否有个具体数据指导? 另外,这些新词,我通过官方提供的get_tf.php查询了一百个词,...

46.RE: scws 词库与dict_user.txt文件有什么关系?

发布时间:2012-04-19 11:04 t By hightman

不明白你说的。同义词是基于分词后的结果制作的。 如果你的索引先前制作,后面再添加自定义词,那么当然无效了。你要重建索引

47.RE: scws分词碰到连字符的词处理的问题

发布时间:2010-06-24 11:06 t By hightman

...condj Thu Jun 24 11:00:20 2010 *************** *** 326,342 **** ch = txt[start]; if (pflag & PFLAG_DIGIT) { ! if (!SCWS_IS_DIGIT(ch)) { // strict must add: !$this->_is_digit(ord($this->txt[$start+1]))) if ((pflag & PFLAG_ADDSYM) || ch != 0x2e || !SCWS_IS...

48.RE: 【BUG】scws add txt dict 递归栈溢出问题?

发布时间:2013-06-11 15:06 t By ronliu

这个应该没问题吧,我用你们提供的gen_scws_dict 在linux上按照你们给的方法转换的,没有报出错误! 不过后来我将转换后的xdb用你们提供的php dump_xdb_file.php 将其转回发现少了7条。

49.RE: 为何导出txt,里面内容不动在创建XDB之后速度变慢很多很多

发布时间:2011-03-14 14:03 t By hightman

是PSCWS本身慢,要用DLL的才快一些

50.RE: 自定义的 txt 字典 有关问题 求助

发布时间:2010-04-09 17:04 t By lerado

哦,我没有说清楚,我用的是PHP版的,是一个词典文件,生成两次XDB,每次里面的分格符不同,上面说的。 我还有就是刚才我试了,我用我自定义的词生成词典,用scws_set_dict添加我的词典后(词典中的word TF IDF 都很高的,记...

  • 时间不限
  • 按相关性排序