搜索

大约有 50 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.4874秒)

31.RE: 请问如何只返回名词?

发布时间:2013-09-10 15:09 t By hightman

分词问题请到scws版问,自己根据词性过滤吧。

32.RE: 关于词频的解释

更新时间:2013-04-15 11:04 t By hightman

加大,前门,缩小,从前 不过这个是词性关系,可以考虑增大 p(1) + n 的权重。 在 etc/rules.ini 和 etc/rules.utf8.ini 的 [attrs] 后方加入 p(1) + n = 5 即可 我们的DEMO已经更新,[url]http://www.xunsearch.com/scws/demo/v4.php[/url] 您也可以参见我们...

33.“有空间”的分词有问题和扩充词典

更新时间:2013-05-18 14:05 t By lyjkensou

....xdb到.txt的转换了吗? 添加新词时,一个词能对应多个词性吗?

34.RE: 搜索的log

发布时间:2012-04-05 10:04 t By hightman

...接口,只要把这些黑词加到自定义词典,并取一个独特的词性,那么就可以用 XSTokenizerScws::hasWord() 的功能来判断是否包含黑词?

35.XSTokenizerScws::getResult

...回词汇数组, 每个词汇是包含 [off:词在文本中的位置,attr:词性,word:词] 源码: sdk/php/lib/XSTokenizer.class.php#L339 (显示) public function getResult($text){ $words = array(); $text = $this->applySetting($text); $cmd = new XSCommand(XS_CMD_SEARCH_SCWS_GET, XS_CMD...

36.RE: 自定义的 txt 字典 有关问题 求助

发布时间:2010-04-09 15:04 t By hightman

...效果有一定影响的,TF主要用于词的切分,IDF用于统计,词性就用在取TOP时过滤或标注上。 最好是基于现有的词典去补充,你重建一个的话数据又都没有效果可能会比较差。SCWS主页上有一个TF/IDF计算器,你可以参看一下效果...

37.RE: 三个问题需要求教

发布时间:2011-01-18 21:01 t By hightman

...,ZMAIN只会切出包含在词典中的字。(像那些切完是 /un 词性的字则不在ZMAIN中)

38.Libscws C API 使用说明

更新时间:2010-12-30 22:12 t By hightman

...动重设为10。参数 xattr 用来描述要排除或参与的统计词汇词性,多个词性之间用逗号隔开。当以~开头时表示统计结果中不包含这些词性,否则表示必须包含,传入 NULL 表示统计全部词性。 [b]返回值:[/b]返回词表集链表的头指针...

39.在做一个PHP的项目。 部分功能用到scws。 大家多多交流

更新时间:2010-05-11 18:05 t By xiaolan

... 怎么样让用户搜索到他想要的信息, 这就要对关键词的词性进行分析过滤了。。 还有用户的搜索习惯/搜索的分类, 以及其他的一些排序条件 随便说说。。就是看着一个好作品的论坛有点冷清, 来发个贴。。 程序菜鸟一个 ...

40.三个问题需要求教

发布时间:2011-01-17 11:01 t By nftw

1, 当英文或数字与汉字链接时,词性会被视为un。如"LG集团",LG与集团紧连着,这种情况下,我希望把LG也视为en。能不能通过修改rules改变呢?因为我不是太理解un指的是什么,好像助词'的'、标点符号等都被视为un。我在插入...

12345
  • 时间不限
  • 按相关性排序