搜索

大约有 60 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0056秒)

11.英文可以定义词性吗?

发布时间:2013-08-30 05:08 t By mynoname

通常英文是不需要分词的,但很多时候词性是需要的,比如nike,dior这类品牌英文。 目前默认词性都是en,有什么办法可否定义词典来改变他的词性。 还有个问题,就是纯数字的词性为什么是en呢,不是m? 望赐教。

12.“枪王之王”分词不是很满意!

发布时间:2010-09-10 14:09 t By johnbaby

...王“作为关键字。而我己的系统是不查询单字的。在定义字典中又不知如何操作。毕竟感觉三个字的词在定义字典中起了作用。而四个字的却没有预期的结果。 还望版主提示一二。怎么在定义词典中设置”四个词“...

13.使用定义词库的时候,部分词会丢失

更新时间:2014-04-18 17:04 t By tianly

使用的版本是SCWS-1.2.2 我用己的词库替换了dict.utf8.xdb,然后尝试分词“朝鲜近日播放的一个纪录片中,发现”,发现“纪录片中”在分词结果中丢失了 Array ( [word] => 朝鲜 [off] => 0 [len] => 6 [idf] => 0 [attr] => @ ) Array ( [word] => 近...

14.RE: 定义词库如何使用?

发布时间:2013-05-13 15:05 t By hightman

这个是内置的一个复合分词功能。你要关闭这个功能可以在搜索时: $xs->search->setScwsMulti(0);

15.SCWS定义修改问题

发布时间:2013-11-20 16:11 t By kimiduan

我们在修改的过程中想把书名号里的文字和单词不进行分词处理,请问要如何修改?是不是先判断书名号?

16.定义词库如何使用?

发布时间:2013-05-12 11:05 t By hq22

网页设计 分词后变成 网页设计 网页 设计 我想把网页设计就分为网页设计一个词,不需要搜索出含有网页跟设计的内容。 我在dict_user.txt加入 网页设计 这个词,好像并没有效果,还是搜索出来含有网页跟设计的文档。

17.开发规范

...的项目配置 ini 文件统一放入 `$prefix/sdk/php/app` 目录。 定义或扩展的类库请统一放入 `$prefix/sdk/php/lib` 以便 `XS` 进行 `autoload`。 保留字 ----- 所有 `Xunsearch PHP-SDK` 的系统类库定义时均以 `XS` 开头,为避免冲突,请行编写 代码...

18.RE: 定义的 txt 字典 有关问题 求助

发布时间:2010-04-10 13:04 t By lerado

哦,是用tab符分开呀,我还以为用空格分开呢,我又重新生成了一次,看了一下分词效果还不错。 谢谢。

19.RE: 定义的 txt 字典 有关问题 求助

发布时间:2010-04-09 15:04 t By hightman

那个属性对分词效果有一定影响的,TF主要用于词的切分,IDF用于统计,词性就用在取TOP时过滤或标注上。 最好是基于现有的词典去补充,你重建一个的话数据又都没有效果可能会比较差。SCWS主页上有一个TF/IDF计算器,你可...

20.RE: small50,big161这种词汇搜索不到

发布时间:2013-06-18 11:06 t By hightman

@FIXME: 先记录一下,这是因为你既是定义分词器又指定了 non_bool 参与权重计算。 那么 SDK 端先按定义分词器拆分重新组合成查询语句,发送到 xapian 解析器时由于不是 boolean prefix,因此它又会调用内部切词法再次切割。 简...

  • 时间不限
  • 按相关性排序