搜索

大约有 20 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0065秒)

1.如何设置“定义词典”的路径?

更新时间:2010-10-28 14:10 t By johnbaby

...。我的文件放置的结构是这样的: “etc”:放置“定义词典” 我的网站的目录结构是这样: [code]www【根目录】 |---mySite【子目录】 |---include【子目录】 |---使用分词功能的页面.php【php代码调用正确:"....

2.RE: 这个不支持英文词典和中英文混合词典

发布时间:2012-02-22 19:02 t By vanni

如果只要文章中有Linux出现就算是Linux相关文章的话,其实是不需要分词了,直接用全文搜索Linux就好了。 只是SCWS目前看前来它的定义词典不支持超过3个字,如果可以的话,可以通过定义“Linux优化”来指定分词

3.英文可以定义词性吗?

发布时间:2013-08-30 05:08 t By mynoname

通常英文是不需要分词的,但很多时候词性是需要的,比如nike,dior这类品牌英文。 目前默认词性都是en,有什么办法可否定义词典来改变他的词性。 还有个问题,就是纯数字的词性为什么是en呢,不是m? 望赐教。

4.hm老大,英文词典的问题

发布时间:2012-03-22 13:03 t By wodeln

...在一个英文句子里提取其中词频比较高的名词。想到用定义词典己整理英文词。但是发现一个问题。。比如hip pop这样也是一个名词,那现在定义词典里肯定不能有空格的啊。老大能不能把这个也解决一下,这样的话,...

5.使用定义词库的时候,部分词会丢失

更新时间:2014-04-18 17:04 t By tianly

使用的版本是SCWS-1.2.2 我用己的词库替换了dict.utf8.xdb,然后尝试分词“朝鲜近日播放的一个纪录片中,发现”,发现“纪录片中”在分词结果中丢失了 Array ( [word] => 朝鲜 [off] => 0 [len] => 6 [idf] => 0 [attr] => @ ) Array ( [word] => 近...

6.关于扩展词库的问题

发布时间:2012-12-10 15:12 t By timeage

...分词选项] 最短词 二元 重要单字 全部单字 加入定义词库后结果为: 阿斯顿 阿斯 斯顿 阿 斯 顿 发 斯蒂芬 斯蒂 蒂芬 斯 蒂 芬 [b]罗铭 罗 铭 罗[/b] 大大 大 大 罗 我的定义词典为: 铭罗 1 0 n 罗铭 1 0 n 我...

7.“枪王之王”分词不是很满意!

发布时间:2010-09-10 14:09 t By johnbaby

...王“作为关键字。而我己的系统是不查询单字的。在定义字典中又不知如何操作。毕竟感觉三个字的词在定义字典中起了作用。而四个字的却没有预期的结果。 还望版主提示一二。怎么在定义词典中设置”四个词“...

8.RE: [HELP]xunsearch安装好了,搜索没有结果集。。。

发布时间:2011-10-27 16:10 t By hightman

...提供scws的api接口,实现短语分词功能 2.是否可以对scws定义中文词典,方便扩展 [/quote] 目前没有直接支持定义词典,而是直接读取 dict.utf8.xdb 你己改词也必须转换成这个词典文件才能用。 词典转换关于SCWS的网站上有。

9.1.1.2的 定义字典无法使用

更新时间:2010-05-23 01:05 t By 逆雪寒

... centos5 scws 1.1.2 php 以扩展形式安装 . 如果我不显式的定义 $so->add_dict(ini_get("scws.default.fpath") . '/dict.utf8.xdb'); $so->set_rule(ini_get('scws.default.fpath') . '/rules.utf8.ini'); 那么就分词正常. 这个是第一个问题. 第二个问题就是,定...

10.RE: 定义的 txt 字典 有关问题 求助

发布时间:2010-04-09 15:04 t By hightman

那个属性对分词效果有一定影响的,TF主要用于词的切分,IDF用于统计,词性就用在取TOP时过滤或标注上。 最好是基于现有的词典去补充,你重建一个的话数据又都没有效果可能会比较差。SCWS主页上有一个TF/IDF计算器,你可...

12
  • 时间不限
  • 按相关性排序