搜索

大约有 40 项符合查询结果, 库内数据总量为 3,513 项。 (搜索耗时:0.0050秒)

1.分词 对于 词库 里有宝马x6 分词 为宝马和马x6 分词有问题 词库 里 只能添加 宝马 不能宝马x6 (中文 英文和数字在一起 存在分词问题)

发布时间:2013-07-04 16:07 t By louyefeiwu

分词 对于 词库 里有宝马x6 分词 为宝马和马x6 分词有问题 词库 里 只能添加 宝马 不能宝马x6 (中文 英文和数字在一起 存在分词问题) #解析后的 QUERY 语句:Xapian::Query((奥迪a6:(pos=1) SYNONYM (奥迪:(pos=89) AND 迪A6:(pos=90))))

3.使用自定义词库的时候,部分词会丢失

更新时间:2014-04-18 17:04 t By tianly

...是SCWS-1.2.2 我用自己的词库替换了dict.utf8.xdb,然后尝试分词“朝鲜近日播放的一个纪录片中,发现”,发现“纪录片中”在分词结果中丢失了 Array ( [word] => 朝鲜 [off] => 0 [len] => 6 [idf] => 0 [attr] => @ ) Array ( [word] => 近日 [off] => 6 ...

4.自定义字典的问题

发布时间:2011-03-14 22:03 t By zfzeng

...库,(测试用的,只放2个词在词库), 然后对这句话进行分词“我爱喝南瓜汤,番茄汤”进行分词, 希望得到结果 我爱喝(未被分词) 南瓜汤(分词OK) , 番茄汤(分词OK) 可是结果什么都没显示。 $so->set_dict("d:\test.x...

5.RE: 二元分词问题

更新时间:2011-11-15 11:11 t By hightman

需要 NEAR 位置信息的话,目前只能用内置的 scws 分词 scws 目前不能自定义词库,你必须把词库转换成 dict.utf8.xdb 一个统一的词库放进 $prefix/etc/ 才可以

6.想在用索引搜索时,输入的关键字不被分词该怎么做?

发布时间:2014-11-20 15:11 t By pbin

想在搜索的时候,关键词按照自己的意愿来切分应该是要怎么做? 文档里看到有个自定义词库的设置,然后根据文档使用了下,发现没达到效果。比如说,我想搜索拥有"味道恶心"这个词的文章,(我的文档库里面是有相关文章的...

7.自定义 SCWS 词库

...定义 SCWS 词库 如之前所说,我们所有的索引分词器默认为 scws,这也是我们开发的开源分词系统, 内置的词库基本上能满足绝大多数应用。但总有例外,这也就是即将说的如何自定义词库。 全局自定义词库 --------...

8.[求助]如何转换pre版本的xdb为txt格式

发布时间:2007-12-25 17:12 t By hackson

...坛主为开源事业所做出的杰出努力,现在网上发布的种种分词工具,绝大部分都只提供了控件或者插件而不直接提供源代码和分词词库,本人非常鄙视那些把分词技术归为秘密的人。共同学习才能共同提高,取长补短,分词是很...

9.RE: 分词不对

更新时间:2010-04-30 13:04 t By hightman

呃确实存在,这都跟这个词库有关系,是互联网上整理的词库,像“法上”居然是专有名词而且权重很高。。。 可以考虑删除“法上”这个错误的词,外挂一个文本词典把“法上”标记为删除或设成更低权重及词性

10.RE: 批量分词问题

发布时间:2010-06-06 11:06 t By hightman

希望能附上完整的PHP代码以及你的自定义词库,以做分析和测试。 从上面少结果的看,应该是词库不生效,而结果只按人名规则合成了2个人名,其它的按无效字符过滤。

1234
  • 时间不限
  • 按相关性排序